高级检索
全部 主题 学科 机构 人物 基金
词表扩展: 自动翻译: 模糊检索:
当前位置:首页>
分享到:

基于随机森林的P2P网络借贷成功率重要影响因素研究
The Important Factor Research of the P2P Lending Based on Random Forest

传统金融体系改革和发展的速度相对滞后,以及不论是商业银行还是证券公司等传统金融机构"高大上"的姿态,都使得一方面资金的供给者很难找到适合的投资产品,进行有效的资产配置;另一方面大量的资金需求者,比如中小微企业、普通居民,仍然难以满足其日常的资金需求.在当前资本需求和供给出现结构性失衡的背景下,以p2p网络借贷为典型模式的互联网金融"横空出世",成为了传统金融的搅局者.P2P网络借贷是基于互联网金融中介业务的一种创新模式,平台的主要作用是为借贷双方提供信息、信息价值认定和其他促成交易完成的服务,不介入到借贷关系中.全世界首家p2p网络借贷平台-ZOPA于2005年在伦敦成立,由此掀开了网络借贷行业的帷幕.中国的p2p网络借贷行业也于2007年扬帆起航,"拍拍贷"是中国成立最早的网络借贷平台.2010年以后,国内的p2p平台开始遍布祖国大江南北,业务量迅速扩大.2013年至2014年,p2p网络借贷行业在伴随着"跑路"、"兑付困难"、"诈骗"等事件中成交量依然一路高歌猛进.2015年国家出台了《关于促进互联网金融健康发展的指导意见》让一直处于三无地带的p2p网络借贷行业逐渐的规范化、理性化.P2P网络借贷具有诸多优点,首先进入行业要求低,能够充分体现普惠金融这一理念.它的客户群体主要是针对中小微企业主、普通的工薪阶层、创业者等草根阶级.在我国,小微企业数量庞大,国家工商总局2014年发布的《全国小微企业发展报告》显示,截至2013年底,小微企业数量达1169.87万户,占企业总数的76.57%.如果再加上普通的工薪阶层,那么行业将会服务于一个数量庞大的客户群体.其次,较强的灵活性和较高的效率.主要体现在借款额度、借款期限、借款的审核、还款方式上.借贷过程大致概括为:借款申请者需要向平台提交申请材料,之后平台会把审核合格的借款标的发布到网站上,投资者可以根据自身的偏好自主进行投资,借款者按时还本付息即可.P2P网络借贷平台上的标的大多是"金额小"、"期限短"、"需求急".通过这一新型借贷形式淡化繁琐的层层审批,只要通过资质审核,就能简单、便捷获得借款.根据"网贷之家"发布的数据显示,截止2015年年底,我国共有3844家平台,有1350万投资人参与到网络借贷行业,全年行业成交额为10021亿.这一数据足以可见p2p行业火热的程度.今后,有关部门如果能够制定行之有效的法律和行业规章,肃清行业乱象,就能使行业朝着正确的方向发展下去,真正的体现行业的价值.P2P网络借贷也引起了学术界的广泛关注,国内的学术研究主要是采用定性分析的方法,集中研究它的起源和发展,平台的运营模式,目前行业存在的问题等等,但是对影响p2p网络借贷成功率的因素进行实证分析的文献相对比较少.为什么要研究p2p网络借贷成功率的影响因素?结合本文收集的"人人贷"借贷平台上2015年第一季度所有交易数据显示,网络借贷成功率只有3.9%.这意味着绝大多数的借款人的融资需求是得不到满足的,网络借贷极低的成功率必然会严重制约平台的发展.总结国内外对影响p2p网络借贷成功率因素的文献时发现,学者们在进行实证分析时,几乎都采用了传统统计学模型,由于传统的计量方法对数据满足一定的假设或是要求,一旦不能很好地满足前提假设或者要求,就会导致模型的结果失真、预测精度差.因此,本文首次将在其他领域广泛应用的机器学习方法-随机森林运用到了研究p2p网络借贷成功率影响因素分析中.随机森林指的是利用多棵树对样本进行训练并预测的一种分类器.随机森林是一种非常成熟的算法,被广泛运用到各个领域,比如生物学、地质学、基金收益率预测等,但是尚未被运用到研究p2p网络借贷.随机森林具有诸多的优点,比如预测精确度比线性和广义线性模型高,同时计算量没有神经网络那么庞大,不需要考虑Logistic模型中要求的自变量的共线性问题,对数据缺失有很强的容忍度等.随机森林具有的这些优点非常适合用来处理本文的数据.因此,本文以"人人贷"2015年第一季度平台上所有的交易为原始数据,采用随机森林法从33个变量之中挑选出若干重要的变量建立预测模型,并将该模型与其他方法(决策树法、神经网络、支持向量机、贝叶斯算法、Logistic)建立的模型进行对比.得出的结论是,第一,随机森林算法的准确率比决策树、支持向量机、贝叶斯、1ogistic回归和神经网络高.第二,采用随机森林启发式算法得出了借款人的历史借贷成功率、未还清的借款数量、收入认证、信用认证分别是影响借贷成功率第一、第二、第三、第四重要的因素.并且利用这10个变量(历史借贷成功率、未还清借款数量、收入认证、工作认证、信用认证、信用等级、身份认证、预期金额、贷款金额和借款成本)建立的随机森林模型预测准确率最高.文章所建立的基于非参数随机森林的借贷成功率评估模型可以灵敏的选出成功率比较高的订单,提高了投资者选择的有效性,并且该模型避免了复杂的计算过程,适用于网络借贷平台上的海量且不断增加的订单.同时首次将随机森林方法应用到我国网络借贷成功率评估模型上,该模型的成功建立,充实了网络借贷行为理论的研究,更为将来网络金融的进一步实际应用奠定了重要实证基础.通过本文的研究,希望能为解决P2P借贷成功率低的问题献上绵薄之力,也希望有关的监管政策能够尽快落实,推动行业健康有序的发展!

作者:
罗璇
学位授予单位:
西南财经大学
专业名称:
金融(专业学位)
授予学位:
硕士
学位年度:
2016年
导师姓名:
张晓玫
中图分类号:
F724.6;F832.4
关键词:
随机森林;smote算法;P2P网络;历史借贷成功率
原文获取
正在处理中...
该文献暂无原文链接!
该文献暂无参考文献!
该文献暂无引证文献!
相似期刊
相似会议
相似学位
相关机构
正在处理中...
相关专家
正在处理中...
您的浏览历史
正在处理中...
友情提示

作者科研合作关系:

点击图标浏览作者科研合作关系,以及作者相关工作单位、简介和作者主要研究领域、研究方向、发文刊物及参与国家基金项目情况。

主题知识脉络:

点击图标浏览该主题词的知识脉络关系,包括相关主题词、机构、人物和发文刊物等。

关于我们 | 用户反馈 | 用户帮助| 辽ICP备05015110号-2

检索设置


请先确认您的浏览器启用了 cookie,否则无法使用检索设置!  如何启用cookie?

  1. 检索范围

    所有语言  中文  外文

  2. 检索结果每页记录数

    10条  20条  30条

  3. 检索结果排序

    按时间  按相关度  按题名

  4. 结果显示模板

    列表  表格

  5. 检索结果中检索词高亮

    是 

  6. 是否开启检索提示

    是 

  7. 是否开启划词助手

    是 

  8. 是否开启扩展检索

    是 

  9. 是否自动翻译

    是