浅谈金融行业中的数据挖掘 口丈/张俊芝 (河北大学文科综合实验教学中心河北・保定) [提要]数据挖掘就是利用各种技 ((Building the Data Warehouse))中提出的。 论的非参数识别技术,不仅保持了多元参 术从海量的数据中发现知识,它具有广阔 w.H.Inmon给数据仓库下的定义是:“数 数,非参数统计的一些优点,而且克服了 Subject—Oriented)的、 其不足,主要表现在:自动进行变量选择 的应用前景。本文比较详尽地概论总结数 据仓库是面向主题(ntegrated)的、稳定(Nonvolatile)的、 降低维数,充分利用先验信息处理数据间 据挖掘的概念、方法及应用,并且分析、归 集成(ITime—Variant)的数据集合,用以支 的非同质的关系,并可有效地用于对数据 纳数据挖掘在金融领域的应用,具体包括 时变(趋势预测、客户关系管理、金融犯罪侦测、 持管理决策的制定过程。”数据仓库可以 的分类。 风险识别与管理等。 关键词:数据挖掘;金融数据;预测; 风险识别 在数据模型的指导下,收集系统内部和系 三、数据挖掘的主要步骤 1、定义问题。对目标有一清晰、明确 个目标应是可行的、能够操作与评价的。 2、数据收集 大量全面丰富的数据是 就无从作起。因此,数据收集是数据挖掘 统外部的数据信息,保证数据的一致性、 析利用。 二、数据挖掘的主要技术 准确性和时效性,真正实现数据共享和分 的定义,也就是确定需要解决的问题,这 中图分类号:F83文献标识码:A 原标题:浅谈金融行业中的数据挖掘 收录日期:2013年5月28日 银行、证券公司、保险公司每天的业 在应用到金融领域的各种数据挖掘 数据挖掘的前提,没有数据,数据挖掘也 技术中,主要有以下几种方法: 1、基于神经网络的方法。神经网络方 的首要步骤。数据可以来自于现有事务处 3、数据整理。数据整理是数据挖掘的 务都会产生大量数据,利用目前的数据库 法是模拟人脑信息加工过程的一种智能 理系统,也可以从数据仓库中得到。 系统可以高效地实现数据的录入、查询、 化信息技术。人工神经网络是电脑通过多 系和规则,无法根据现有的数据预测未来 别模式的功能建造起来的。的发展趋势。 统计等功能,但无法发现数据中存在的关 重输入相似平行处理结构来模拟人类识 必要环节。由数据收集阶段得到的数据町 能有一定的“污染”,表现在数据可能存在 神经网络很适合非线性数据和含噪 自身的不一致性,或者有缺失数据的存在 如何才能不被信息的汪洋大海所淹 声数据,所以在市场数据库的分析和建模 等,因此数据的整理是必需的。同时,通过 没,从中及时发现有用的知识,提高信息 方面应用广泛。神经网络提供了一类准确 数据整理,可以对数据做简单的泛化处 从而在原始数据的基础之上得到更为 利用率呢?于是,数据挖掘技术就应运而 性令人满意、程度上接近金融模式的工 理, 生,并得以蓬勃发展,越来越显示出其强 具。丰富的数据信息,进而便于下一步数据挖 大的生命力。缺乏挖掘数据背后隐藏的知 2、基于贝叶斯网络的方法。贝叶斯网 掘的顺利进行。 4、数据挖掘。利用人工智能、数理统 识的手段,导致了“数据爆炸但知识贫乏” 络,又叫概率因果网络、信任网络、知识图 的现象。它可以从大量的数据中抽取潜在 等,是一种有向无环图。贝叶斯网络用图 计等各种数据挖掘方法对数据进行分析, 的有用信息和模式,来帮助我们进行科学 形来表示变量间连接概率关系。结点表 发现有用的知识与模式。这是整个过程的 的决策。 一 示:领域变量;有向边:结点间的依赖关 核心步骤。、基本概念 系;对每一个结点都对应着一个条件概率 5、数据挖掘结果的评估。数据挖掘的 而有些是没有 1、数据挖掘(Data Mining)。数据挖 分布表,该分布表指明了该变量与父结点 结果有些是有实际意义的, 掘又称数据开采、数据发掘等,就是从大 之问的依赖关系。量的、不完全的、有噪声的、模糊的、随机 实际意义的,或是与实际情况相违背的, 3、遗传算法。遗传算法的基本思想是 这就需要进行评估。评估可以根据用户多 的数据中,提取隐含在其中的、人们事先 给出一个问题,在特有的人口遗传群体中 年的经验,也可以直接用实际数据来验证 不知道的但又是潜在有用的信息和知识 潜在地含有解决方案或者较好的解决方 模型的正确性,进而调整挖掘模型,不断 遗传算法反复 重复进行数据挖掘。 的过程。发现了的知识可以被用于信息管 案。基于遗传和进化原则, 理、查询优化、决策支持、过程控制等,还 修改人口的人工结构,操作员通过预置、6、分析决策。数据挖掘的最终目的是 辅助决策。决策者可以根据数据挖掘的结 总之,数据挖掘过程需要多次的问题 可以进行数据自身的维护。 2、数据仓库(Data Warehouse)。数据 选择、交叉和改变来逐步形成解决方案。 4、基于规则和决策树的工具。决策树 果,结合实际情况,调整竞争策略等。 仓库是w.H.Inmon在1993年所写的论著 方法作为一种数据挖掘实现基于统计理 圈 《合作经济与科技》2013年8月号上(总第470期) 科技型中小企业融资问题研究 口文/张旋 (河北经贸大学工商管理学院河北・石家庄) [提要]科技型中小企业是国民经 原标题:融资渠道视角下科技型中小 资需求。 济的重要组成部分,其发展的关键是走 企业融资问题研究 一、国内科技型中小企业的融资渠道 “技术+资金”的道路。由于缺少资金,众 收录El期:2013年5月28日 企业的融资方式与融资渠道有着密 多技术含量高、发展前景好的企业走入 科技型中小企业在快速成长中面临 切的关系。两者研究的内容相同,只是研 “死亡峡谷”。为解决这个问题,积极 的融资困境严重制约着企业的发展壮大。 究的方向不同,因此很多学者并未对二者 开辟各种资金渠道,虽然在一定程度上缓 为解决发展瓶颈,积极开辟各种融资 严格区分。本文为便于研究,对融资渠道 解了一些科技型中小企业的融资难题,但 渠道,一系列措施的出台缓解了一些 和融资方式进行了界定。 企业融资渠道仍不畅通,资金短缺仍是制 企业的融资难题,但是与量大面广的科技 融资渠道是指企业筹措资金的方向 约科技型中小企业发展的主要障碍。本文 型中小企业的巨大资金需求相比,依然是 和通道,体现了资金的来源和流量。目前, 通过对我国科技型中小企业融资渠道、融 “僧多粥少”。企业融资渠道不畅通,资金 国内科技型中小企业的融资渠道主要包 资方式进行界定、梳理、分析,认为选择资 短缺仍是制约科技型中小企业发展的主 括财政资金、银行信贷资本、非银行 金流充沛的民间资本与风险投资相结合 要障碍。因此,如何解决科技型中小企业 金融机构资本、其他法人资本、民间资本、 的融资途径是解决科技型中小企业融资 的融资问题,促进其更健康、快速地发展, 企业内部资本、国外和我国港澳台地区资 难问题的关键。 迫在眉睫。本文通过对我国科技型中小企 本。 关键词:科技型中小企业;融资渠道; 业融资渠道和融资方式进行界定、梳理, 融资方式,指企业筹措资金所采取的 融资方式 以使相关企业和部门充分认识、利用现有 具体形式和工具,体现着资本的属性(指 中图分类号:F83文献标识码:A 渠道并对其进行完善和创新,最终满足融 资本的股权或债权性质)和期限。目前国 修改、模型调整、重新评估、检验等循环反 场占有率及企业的竞争能力。数据挖掘能 格走势预测、客户需求的变化趋势等。 复,才有可能达到预期的效果。 够帮助企业找出对企业有重要意义的客 4、识别金融欺诈、洗钱等经济犯罪。 四、数据挖掘在金融业的应用 户,包括能给企业带来丰厚利润的黄金客 金融犯罪是当今业内面临的棘手问题之 数据挖掘在金融领域应用广泛,包 户和对企业进一步发展至关重要的潜在 一,包括恶意透支、盗卡、伪造信用卡、盗 括:金融市场分析和预测、账户分类、银行 客户。 取账户密码以及洗黑钱等。要侦破洗黑钱 担保和信用评估等。这些金融业务都需要 2、风险识别与管理。可以建立一个分 和其他金融犯罪,重要的是要把多个数据 收集和处理大量数据,很难通过人工或使 类模型,对银行贷款的安全或风险进行分 库的信息集成起来,然后采用多种数据挖 用一两个小型软件进行分析预测。而数据 类。也可利用数据挖掘技术进行信贷风险 掘工具寻找异常模式,发现短时间内,少 挖掘可以通过对已有数据的处理,找到数 的控制。信贷风险管理主要包括:风险识 数人员之间的巨额现金的流动,发现可疑 据对象的特征和对象之间的关系,并可观 别、风险测量、选择风险管理工具、效果评 线索。 察到金融市场的变化趋势。然后,利用学 价。信息的庞杂造成手工评估、管理的难 习到的模式进行合理的分析预测,进而发 度大大增加。而现有的银行信贷系统一般 主要参考文献: 现某个客户、消费群体或组织的金融和商 都是业务运营系统,并非为决策分析应用 [1]樊重俊,王浣尘.遗传算法的改进与应 业兴趣等。 而建立,其数据的集成性、完整性、可访问 用【J].上海大学学报,1998.1 2. 1、客户关系管理。数据挖掘可以进行 性、可分析性都难以满足信贷风险分析的 [2】王明进,程乾生.自组织网络在混沌时 客户行为分析来发现客户的行为规律,包 需求。为此,可以建立一套于业务系 间序列预测应用[J].系统工程理论与实 括整体行为表现和群体行为模式,市场部 统的数据仓库,专门解决信贷分析和风险 践,1 997.7. 门可以根据这些规律制定相应的市场战 管理的问题。 [3]姚洪兴,盛昭瀚,陈洪香.股市预测中 略与策略:也可以利用这些信息找出客户 3、市场趋势预测。数据挖掘技术可以 的小波神经网法[J】.系统工程理论与实 的关注点及消费趋势,从而提高产品的市 进行数据的趋势预测,比如金融市场的价 践,2002.6. 《合作经济与科技》2013年8月号上(总第470期) 困