این نوشتار مبانی نظری و پیشینه تحقیق داده کاوی در صنعت بانکداری می باشد. در بخش اول چارچوب و مبانی نظری داده کاوی در صنعت بانکداری تشریح می شود و در بخش دوم پیشینه نظری تحقیق داده کاوی در صنعت بانکداری در پژوهش های داخلی و خارجی مورد بررسی قرار می گیرد.
 

 

 

 

مقدمه مبانی نظری داده کاوی در صنعت بانکداری


 

بخش بانكداري طبق الگوي پورتر براي فعاليت در محيط رقابتي امروز با پنج نيروي رقابتي مواجه است كه يكي از آن‌ها قدرت چانه زني مشتري است. افزايش رقابت بين بانک‌ها، تغيير قوانين و معرفي فناوری‌های جديد و خصوصاً زيرساخت اينترنتي سبب افزايش آگاهي مشتريان به همه امور شده است و در نتيجه قدرت چانه زني مشتري را بيشتر كرده است، به طوري كه مشتري قادر است در كمترين زمان به بانك ديگري رجوع كند [11].
 

 

 

صنعت بانكداري در جهان تحت تغييرات شديد در طريقه انجام كسب و كار می‌باشند. بانک‌های پیشرو از ابزارهاي داده‌کاوی براي بخش بندي، تعيين سودمندی، دسته بندي اعتبار، پيش بيني قصور در بازپرداخت ها، بازاريابي، تشخيص تراکنش‌های متقلبانه و غيره استفاده می‌کنند. این ابزار به عنوان یک ابزار رقابتی در بانک شناخته شده است [11].

 

 


داده يكي از با ارزش‌ترین دارایي هاي شرکت‌ها می‌باشد، اما فقط در صورتي كه بدانيم چگونه دانش در آن‌را آشكار كنيم. داده كاوی امکان استخراج دانش موجود در داده هاي تاريخي و پيش بيني پيامدهاي موقعيت هاي آينده را در اختیار می گذارد. داده‌کاوی ابزار ارزشمندي می‌باشد كه با کمک آن يك سازمان می‌تواند با شناسايي اطلاعات مفيد بالقوه از مقدار اطلاعات جمع آوري شده، مزيت واضحي نسبت به رقبايش كسب نمايد [11].كاهش هزينه اي ذخيره سازي داده‌ها و افزايش راحتي در ذخيره-سازي داده‌ها، توسعه الگوریتم‌های قوي و مؤثر يادگيري ماشين براي پردازش داده‌ها و كاهش هزينه قدرت محاسباتي از عواملی است که باعث گسترش و علاقه به داده‌کاوی گشته است [11].

 

 

 

 

کاربرد داده‌کاوی در ارزیابی اعتبار مشتریان

عبدو و همکاران در [29] به مطالعه داده‌های مشتریان یک بانک مصری که از این بانک وام گرفته بودند پرداختند. در این مطالعه مشتریان بانک از لحاظ اعتبار دسته‌بندی شدند. الگوریتم‌های بکار رفته در این مقاله شبکه‌های عصبی احتمالی و چند لایه و رگرسیون لاجیت و ورودی های این الگوریتم ها اطلاعات شخصی مشتری شامل سن، درآمد ماهانه، جنسیت، وضعیت تأهل، وضعیت مسکن، مقدار وام، مدت بازپرداخت و... بوده است. در این تحقیق عملکرد شبکه‌های عصبی احتمالی و چند لایه با روش‌های مرسوم مانند آنالیز تفکیکی، رگرسیون منطقی و آنالیز بر اساس حداقل انحراف از میزان متوسط مقایسه شده است. نتایج حاصل بیانگر این مسئله است که رگرسیون لاجیت با 88% پیش بینی صحیح عملکرد بهتری نسبت به روش‌های مرسومی که نام برده شد، داشته است؛ و در مقایسه کلی شبکه عصبی با 96% دقت بهترین عملکرد را داشته است.

 

 


لی و همکاران در [22] یک روش ترکیبی جدید برای انتخاب داده‌های ورودی دسته‌بندی مشتریان بانک جهت ارزیابی اعتبار آنان معرفی کرده اند. در این مقاله رویکردی ترکیبی که حاصل ترکیب رویکردهای انتخاب ویژگی موجود (آنالیز ترکیبی خطی، تئوری مجموعه های ناهموار، درخت تصمیم و روش Fscore) با روش ماشین بردار پشتیبان  است برای انتخاب متغیرها معرفی شده و در ادامه مقایسه-ای بین رویکردهای ترکیبی بر پایه SVM به منظور انتخاب ویژگی ها صورت گرفته است. در این تحقیق از داده‌های معروف مربوط به کارت های اعتباری UCI مربوط به کشور آلمان و استرالیا استفاده شد. تمرکز مقاله بر یافتن مرتبط ترین ویژگی ها با اهداف منظور است و بیان می شود که مسئله مهم نه فقط کاهش حجم متغیرهای ورودی بلکه حذف نویزهای ورودی نیز می باشد. نتایج حاصل نشان می-دهند که عملکرد روش ها به صورت ترکیبی در انتخاب ویژگی‌های ورودی بسیار بهتر از عملکرد هر یک از این روش ها به طور منفرد است.

 

 

 


کاربرد داده‌کاوی در تحلیل روی‌گردانی مشتری 

مسئله حفظ مشتری و افزایش وفاداری او به سازمان از مسائلی است که هسته اصلی بحث ارتباط با مشتری را تشکیل می‌دهد. با تحلیل داده‌های بر جای مانده از مشتریانی که سازمان را ترک نموده اند، قوانین و الگوهایی حاصل می شود که می توان به کمک آن ها مشتریانی که احتمال می رود در آینده نزدیک سازمان را ترک کنند و به سوی رقیب بروند شناسایی نمود. بدین ترتیب مدیران می توانند با اخذ تصمیماتی جهت بهبود ارتباط با این‌گونه مشتریان مانع از روی‌گردانی آنان گردند.در [19] از الگوریتم‌های داده‌کاوی جهت ساخت مدلی به منظور پیش بینی روی‌گردانی مشتریانی که از کارت اعتباری استفاده می کنند استفاده شده است.

 

 

این تحقیق بر روی پایگاه داده مشتریان یک بانک چینی صورت گرفته و از چهار دسته متغیر اطلاعات مشتری، اطلاعات کارت اعتباری، داده‌های مربوط به ریسک مشتری و اطلاعات مربوط به تراکنش ها استفاده شده که در مجموع شامل 135 متغیر می-باشد. از بین این متغیرها 95 متغیر با توجه به همبستگی بین آن ها برای انجام مراحل بعدی انتخاب شدند. در این تحقیق مشتری روی‌گردان فردی تعریف شده که در طول دوره مشاهده  دوازده ماهه هیچ تعاملی را با بانک نداشته است. در این تحقیق الگوریتم‌های رگرسیون و درخت تصمیم جهت دسته‌بندی مشتریان انتخاب شده و نتایج تحقیق نشان داد که عملکرد مدل های رگرسیونی کمی بهتر از عملکرد درخت های تصمیم بوده است. در این تحقیق یک فاصله یک ساله به عنوان دوره ارزیابی عملکرد  در نظر گرفته شد.
 

 

 

 

 

 

*** سایر مبانی نظری و پیشینه تحقیق در مورد داده کاوی در لینک زیر قابل دسترس هستند:

لیست تمام مبانی نظری و پیشینه تحقیق درباره داده کاوی

 

 

 

 

 

فهرست مطالب

مبانی نظری  در مورد داده کاوی در صنعت بانکداری

 

ادبیات و پیشینه تحقیق در مورد داده کاوی    2

2-1- مقدمه    3
2-8- داده‌کاوی    5
2-8-1- مقايسه روش‌های آماری و داده‌کاوی    7
2-8-2- مفهوم داده‌کاوی    9
2-8-3- داده‌کاوی و کشف دانش    11
2-8-4- فرايند داده‌کاوی    14
2-8-5- معرفی روش‌های داده‌کاوی    21
2-8-5-1- دسته‌بندی    23
2-8-5-2- درخت تصمیم    24
2-8-5-3- شبکه‌های عصبی    25
2-8-5-4- پیش بینی    27
2-8-5-5- خوشه‌بندی    28
2-8-5-5- انواع خوشه‌بندی    29
2-8-5-5-2- معیارهای ارزیابی در خوشه‌بندی    31
2-8-5-6- تحلیل انحراف    33
2-8-5-7- قواعد وابستگی (انجمنی)    34
2-8-5-8- تحلیل توالی    34
2-8-6- نرم‌افزار داده‌کاوی    36
2-8-7- کاربردهای داده‌کاوی    37
2-8-7-1- داده‌کاوی در صنعت بانكداری    38
2-9- پیشینه تحقیق    39
2-9-1- کاربرد داده‌کاوی در بخش‌بندی و مدل‌سازی رفتاری مشتریان در صنعت بانکداری    41
2-9-2- کاربرد داده‌کاوی در ارزیابی اعتبار مشتریان    44
2-9-3- کاربرد داده‌کاوی در زمینه کشف تقلب    46
2-9-4- کاربرد داده‌کاوی در تحلیل روی‌گردانی مشتری    47

پیشینه تحقیق در مورد داده کاوی در صنعت بانکداری

 

منابع