تجارت الکترونیکی تلفیقی و قرآیند تعیین الگوهای سودمند تجاری (DataMining)
34 صفحه در قالب word
چکیده :
ما نشان می دهیم که حوزه تجارت الکترونیکی می نواند همه اجزا مورد نیاز برای یک فرآیند موفق تعیین الگوهای سودمند تجاری را فراهم سازد و در عین حال عقیده داریم که این یک حوزه موثر برای فرآیند ذکر شده است . ما بر اساس تجاربمان در شرکت نرم افزاری بلو مارتینی (Blue Martini ) در ارتباط با معماری تلفیقی توضیح خواهیم داد تا نشان دهیم که این امر بر اساس تجربه صورت گرفته است .
معماری به طور قابل توجهی می تواند زمان انجام پیش پردازش ، پاک سازی و اقدامات شناخت داده ها را کاهش دهد که معمولاً این کارها حدود 80% زمان پروژه های کشف اطلاعات را در بر می گیرد . به منظور پشتیبانی از ثبت داده ها و فوق داده ها که برای فرآیند کشف مفید است ، ما تاکید می کنیم که جمع آوری داده ها در لایه سرویس دهنده کاربردی صورت بگیرد نه در سرویس دهنده وب.
توضیح داده خواهد شد که پل های انتقال داده بین سیستم های پردازش گردش کار یا جریانهای رخدادی خریدار ( به طور مثال : جریان کیلیک) و محل انبار داده ها مورد نیاز است همچنین به تفصیل در ارتباط با استخراج اطلاعات ، کاری که نیاز مند داشتن چندین دیدگاه از داده ها از طریق گزارش، الگوریتم های data mining تجسم و OLAP می باشد ، توضیح خواهیم داد . و با بیان چندین چالش در این زمینه مقاله خود را به پایان خواهیم برد .
OLAP : یک سیستم بانک اطلاعاتی رابطه ای ، با قابلیت پردازش پرس وجوهای پیچیده تری نسبت به بانکهای رابطه ای استاندارد که از طریق دسترسی چند بعدی به داده ها ( که در آن داده ها با معیارهای مختلفی مورد توجه قرار می گیرند) قابلیت محاسبه زیاد و روشهای ویژه اندیس گذاری انجام می شود .
مقدمه :
تجارت الکترونیکی در حال پیشرفت است و همگام با این پیشرفت ، شرکت ها علاقه بیشتری دارند تا در زمینه پیشرفت تجارت آن لاین (ONLINE) سرمایه گذاری کنند . در کتاب COMMERCE SOFTWARE TAKESOFF ، نویسندگان تحقیق forrester نوشتند که در سال 1999 تجارت آن لاین در زمینه خرده فروشی مصرف کننده حدود 3/20 میلیارد دلار بوده است و پیش بینی شده است که تا سال 2003 به بیش از 144 میلیارد دلار برسد . حدود 2500 شرکت جهانی در سال 2000 میلادی نسبت به سال 1999 بیش از 72% در زمینه تجارت الکرونیکی سرمایه گذاری خواهند کرد . سایت های موجود از اندازه گیرهای اولیه همچون تعداد بازدید صفحات استفاده می کنند اما نیاز برای تحلیل و خصوصی سازی با توجه به نیاز های متفاوت روز به روز افزایش می یابد . در کتابMeasuring websuccess نویسندگان ادعا می کنند که افراد پیشرو از واحدهای متدی برای ایجاد خصوصی سازی استفاده می کنند و اینکه شرکت ها به هوش شبکه نیاز دارند نه به تحلیل موارد ثبت شده .
ابزار data mining به کشف الگوهای داده ها کمک می کنند . تاکنون شرکتها یی که بر روی ساختار افقی وسایل الگو ساز data mining متمرکز شده بودند ، پیشرفت تجارت کمی داشتند . میزان خرید بسیاری از شرکت ها بدین قرار است : دریافت علوم فشرده توسط Gentia در حدود 3 میلیارد دلار ، هماهنگی بسیار بالا توسط yahoo در حدود 3/2 میلیون دلار ، معتدل سازی به وسیله spss در حدود 7 میلیون دلار و ماشین های متفکر بوسیله oracle در حدود چیزی کمتر از 25 میلیون دلار افزایش یافته اند . KD1 توسط Net Perception در حدود 116 میلیون دلار به دست امد . right point که قبلاً نام data mind داشت توسط E.Piphany برای حدود 400 میلیون دلار و Nero vista توسط Acro برای حدود 140 میلیون دلار به دست آمده است . تغییر این ارزیابی ها تاکید می کند که باید توجه بیشتری را بر ارزش تکنیک های الگو سازیdata mining در زمینه تجارت الکترونیکی داشته باشیم .
تجارت الکترونیکی یک حوزه موثر برای data mining است. این روش ایده ال است زیرا بسیاری از مواد مورد نیاز برای data mining موفق به راحتی به دست می آید : ثبت داده ها بسیار متعدد است، مجموعه الکترونیک داده های قابل اطمینان را فراهم سازد، افکار به راحتی به مرحله اجرا در می آید و بازگشت سرمایه اندازه گیری می شود. اگر چه برای پیشرفت در این حوزه، باید data mining در سیستم های تجارت الکترونیکی با پل های انتقال داده ها از سیستم پردازش گردش کار به محل انبار داده ها و بر عکس مجتمع شود. چنین ترکیبی به طور قابل توجهی زمان آماده سازی داده ها را کاهش می دهد که طی تحقیقات بدست آمده حدود 80 درصد زمان تکمیل یک تحلیل را بر عهده می گیرد. یک راه حل تلفیقی همچنین می تواند برای کاربران یک رابطه مستقیم بین کاربر و پردازش کامل فوق داده ها را ایجاد کند.
این تحقیق بر اساس مواردی که بعدا ذکر خواهد شد، شکل گرفته است. بخش 2 معماری تلفیقی را توصیف می کند و در مورد اجزای سازنده مهم و پل هایی که آنها را به هم وصل می کنند توضیح می دهد. بخش 3 به تفصیل در مورد جمع آوری داده ها صحبت می کند. یعنی باید داده های بیشتری را نسبت به فایل های ثبتی سرویس دهنده شبکه تاکنون مورد استفاده بوده اند، جمع آوری کرد. بخش 4 در مورد اجزای تحلیل گر صحبت می کند که باید طیف وسیعی از وسایل انتقال داده ها و وسایل آنالیز کردن را فراهم کرد. و در ارتباط با بعضی از مشکلات چالش انگیز در بخش 5 صحبت خواهیم کرد. و در بخش 6 با یک جمع بندی مطلب را به پایان خواهیم برد.
معماری تلفیقی :
در این بخش ما در مورد معماری مورد نظر یک بازبینی کلی در زمینه سیستم تجارت الکترونیکی با استفاده از data mining تلفیقی خواهیم داشت. از جزئیات بخش های بسیار مهم معماری و سودمندی آنها در بخش های بعدی بحث خواهیم کرد. این سیستم که در مورد آن شرح دادیم یک معماری ایده آل است که براساس تجارب ما در شرکت نرم افزاری Blue martini بدست آمده است. اگر چه ما هیچ گونه ادعایی نداریم که هر آنچه در اینجا توضیح داده می شود آنرا در شرکت خود اجرا کرده ایم. در معماری مورد نظر ما سه جزء بسیار مهم وجود دارد : تعریف داده تجاری، تاثیر متقابل خریدار و آنالیز. برای اتصال چنین اجزایی سه پل انتقال داده وجود دارد : stage data, deploy Results و customer Interaction. رابطه بین شرکت ها و پل های انتقال داده ها در شکل 1 نشان داده شده است. سپس هر یک از اجزای معماری و پل هایی که این اجزا را به هم متصل می کنند در موردشان توضیح می دهیم.
در جزء تعریف داده تجاری، کاربر تجاری داده ها و فوق داده ها مرتبط با تجارتشان را تعریف می کند. این داده شامل اطلاعات تجاری (بطور مثال : تولیدات، لیست های قیمت و طبقه بندی ) اطلاعات مفهومی (بطور مثال : الگوهای صفحه وب، تصویرها و چند رسانه ای و کالاها) و قوانین تجاری (بطور مثال : قوانین مفاهیم خصوصی شده، قوانین تبلیغ و قوانین چندفروشی و فروش زیاد) است. با استفاده از data mining دورنمایی به دست می آید که کلید جزء تعریف داده تجاری در واقع توانایی در تعریف یک مجموعه قوی از خصوصیات (فوق داده) برای هر نوع از داده می باشد.
بطور مثال تولیدات می توانند خصوصیاتی همچون سایز، رنگ و در نظر گرفتن آن برای یک سن خاص و طبقه بندی شدن در یک مجموعه سلسله مراتبی همچون مردان و زنان و زیر مجموعه هایی که مثل کفش ها و لباس ها را داشته باشد. به عنوان یک نمونه دیگر الگوهای یک صفحه وب می توانند ویژگی هایی داشته باشند. که نشان دهد که آیا آنها تولیداتشان را نشان می دهند نتایج را جستجو می کنند، یا به عنوان قسمتی از فرایند بررسی (تسویه حساب کردن) مورد استفاده قرار می گیرند. داشتن مجموعه متغیری از ویژگی های موجود نه تنها برای data mining مفید است بلکه برای خصوصی سازی تجربه خریدار مفید است. عامل تاثیر متقابل خریدار بین خریداران و شرکت تجارت الکترونیکی رابطه برقرار میکند. اگر چه ما از نمونه یک وب سایت در طول این تحقیق استفاده کرده ایم، اصطلاح تاثیر متقابل خریدار بیشتر با هرگونه تاثیر بر خریداران در ارتباط است، این تاثیر متقابل می تواند دریک وب سایت رخ دهد (بطور مثال از طریق تلفن یا ایمیل)، کاربردهای بی سیمی یا حتی ساده ترین بخش شبکه فروش. برای تحلیل موثرتر همه این منابع داده ها، یک جمع کننده داده مورد نیازاست که جزء تلفیقی از اجزای تاثیر خریدار باشد. برای هماهنگی بیشتر، جمع کننده داده نه تنها باید مطالعات فروش داده را ثبت کند بلکه باید انواع دیگر تاثیرات متقابل خریدار از جمله تعداد بازدیدکنندگان صفحه وب را برای یک وب سایت ثبت کند. جزئیات بیشتر از معماری تلفیقی به منظور ایجاد یک وب سایت در بخش سوم توصیف شده است. برای اشاره کردن به سودمندی (خدمات رفاهی) این جمع کننده داده، بیایید یک نمونه از یک شرکت تجاری که میزان تاثیر تبلیغات بانر شبکه خود را با دیگر سایتها انجام می دهد تا خریداران را به سمت سایت خودش جذب بکند، در نظر بگیریم. قیمت یک آگهی بانر شبکه معمولا بر اساس دفعاتی که بازدیدکنندگان وب سایت بر روی یک بانر تبلیغاتی و در طی دوره خاصی از زمان کلیک می کنند تعیین می شود یعنی هر بار که یک بازدیدکننده صفحه بر روی بانر تبلیغات کلیک می کند باید هزینه ای پرداخت شود. بسیاری از شرکتهای تجارت الکترونیکی میزان تاثیر تبلیغات بانر شبکه شان را با همین واحد اندازه گیری یعنی تعداد دفعات کلیک اندازه گیری می کنند و بنابراین در محاسبه میزان خرید هر فرد دچار مشکل می شوند. اگر هدف فروش بیشتر محصولات است پس سایت نیاز دارد که بیشتر خریداران را جذب کند تا اینکه دنبال جستجوگرها باشد. گزارش اخیر forrester نشان می دهد که « استفاده کردن از تعداد بازدیدهای صفحه به منظور قضاوت در مورد موفقیت یک سایت همانند ارزیابی یک اجرای موسیقی براساس بلندی صدای آن است.» در عمل ما می بینیم که نسبت خریدهای صورت گرفته به تعداد دفعات کلیک در حدود 20 فاکتور در تبلیغات بانر شبکه ای یک شرکت متغیر است. یک تبلیغ پنج مرتبه تولید می شود همچون دیگر تبلیغات در زمینه فروش، بنابراین تعداد دفعات کلیک در تبلیغات پیشین حدود 1/15 جریان کلیک بعدی نیست. توانایی اندازه گیری این نوع ارتباط نیازمند استفاده از ترکیب منابع چندگانه داده می باشد.
ممکن است هنگام انتقال از فایل ورد به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود ولی در فایل دانلودی همه چیز مرتب و کامل است
متن کامل را می توانید در ادامه دانلود نمائید
چون فقط تکه هایی از متن برای نمونه در این صفحه درج شده است ولی در فایل دانلودی متن کامل همراه با تمام ضمائم (پیوست ها) با فرمت ورد word که قابل ویرایش و کپی کردن می باشند موجود است