您好,欢迎来到爱go旅游网。
搜索
您的当前位置:首页基于python爬虫数据的枣庄市二手房价空间分析

基于python爬虫数据的枣庄市二手房价空间分析

来源:爱go旅游网
2018年09月 第35卷第5期

枣庄学院学报

JOURNAL OF ZAOZHUANG UNIVERSITY

Sep. 2018 Vol. 35 NO. 5

基于python爬虫数据的審庄市二手房价空间分析

唐承佳,林真真,付珊珊

(枣庄学院旅游与资源环境学院,山东枣庄277160)

[摘要]利用

python语言设计爬虫程序,在安居客等网站上抓取枣庄市各区市以及主城区二手住房小区均价和空间

位置,建立枣庄市二手住房小区均价的空间数据库;在百度地图API的基础上应用ArcGIS软件进行核密度等相关分 析,探索枣庄市各区市以及主城区住房价格分布空间形态;结合枣庄市各区市以及主城区基础设施、CBD等分布状况

和交通设施进行二手住房价格空间差异规律分析;最后选取最优空间模型,筛选影响住房价格空间分异的显著因数, 心,四个次中心”多个中心发展趋势的空间分布格局特征.

得到枣庄市二手住房小区均价的分布空间形态受到交通情况、基础设施条件、学校和机构的影响,呈现“一个中 [关键词]二手住房小区均价;空间分布;[中图分类号]K902.1

python语言;空间分析;核密度

[文献标识码]A

[文章编号]1004 - 7077( 2018 )05 - 0101 -05

0

引言

住房与居民的日常生活密切相关,整体上看住房均价在空间上也存在差异.研究小

区住房的特征价格,揭示住房平均价格水平的空间分布规律,不仅可以为制定相关 发展规戈!J、进行相关基础设施的建设提供参考建议,也可以为居民选房购房提供更直观 的选择依据以及为进一步研究城市发展水平和房价变动是否合理提供理论依据.

目前国内对住房价格空间分异特点的研究主要分成两类:第一类是创立特征价格模 型,对影响房价的各个因素进行量化,并分析其作用力大小;第二类是使用GIS技术和地 统计学,住房价格的空间分布规律进一步研究探讨.因为影响房价水平差异的许多 因素在不同地理位置上互相作用,使得在一定的区域范围内呈现出房价空间分布具有差 异性,很多学者对北京、上海、广州、深圳等城市的空间格局应用了空间分析方法做出了 详细的研究[21,但当前对三四线城市的房地产价格空间结构和分布规律差异的研究却极 少.本文从地理空间分析的角度,住房地理位置结合城市基础设施、CBD等分布状况以及 交通设施,研究住房均价空间分布规律及其影响因素.

基于python语言设计爬虫程序,在安居客网站、房天下网站上抓取枣庄市各区县和 主城区二手住房小区均价以及其空间位置,建立空间数据库,并将数据库导入ArcGIS软 件中,利用其空间分析功能进行空间分析形成核密度图,结合枣庄市各区县以及主城区 基础设施、CBD等分布状况和交通设施进行二手住房价格空间差异规律分析,确定影响 二手住房价格空间分布差异的因素.为枣庄市房地产开发、城市基础设施合理布局、枣庄 市民合理选购住房提供依据,也有助于制定相关城市住房.

1

研究区状况,数据来源及研究方法

1-1 研究区概况

①[收稿日期]2018 -06-25

[基金项目]国家创新创业项目资助[作者简介]唐承隹1973 -),男,湖南新邵人,枣庄学院旅游与资源环境系副教授,理学博士,主要从事地理信息空间分析研

究.

• 101 •

奉庄学院学报2018年第5期

枣庄市位于鲁中南南部的低山丘陵,处在黄淮冲击平原的一部分地带,全市地势北 部高南部较低,东部高西部略低,整体呈现出从东北向西南方向倾伏.枣庄市面积约有 4550平方公里,其中包括市中区、薛城区、山亭区、台儿庄区、峄城区和滕州市(县级),全 市共有5个事处、39个镇和46个乡.麥庄市经济最初较偏重第一产业,以煤矿出 名.近些年以来,深入推进供给侧结构性改革,不断优化升级枣庄市产业结构的同时,服 务业发展呈现迅猛趋势.

截止到2017年,率庄市地区生产总值约2316. 21亿元,2017年率庄市三次产业结 构由原来7. 5 :51.7 :40. 8改变成7. 0 :51.6 :41.4 ,整体上看:第一产业和第二产业比重呈 现下降的趋势,而第三产业比重则有所上升,2017年服务业增长7. 9%[3].

2017年3月开始,最为严厉的房地产蔓延全国,一系列与房地产有关的政 策密集出台,其目的是不断规范房地产市场管理,枣庄市房地产市场仍流漏出价格持续 上涨的趋势,2017年枣庄市二手住房平均价格同比去年上涨10. 93.

1.2 数据获取及数据处理

基于Python语言编写代码,设计爬虫程序在安居客网站(https ://zaozhuang. anjuke.

com/community/? from = esf_ list _ navigation )、房天下网站(http ://esf. zaozhuang. fang. com/)、^iS房■网女占(http://zaozhuang. zhaofangw. cn/index. php? caid =3 )_t折l取■零市\"5

区1市的二手住房小区的具体名称小区均价以及各小区的具体地址以及经纬度坐标,获 取数据存储于EXCEL表格中•

处理获取的表格数据,对照百度地图(https ://map. baidu. com/)检验并修改小区有 误的经纬度坐标以及小区地址,删除不存在的小区,将整理后的结果依次按照小区名称、 小区均价、具体地址、经纬度坐标的顺序重新存储,建立空间数据库.

1.3 技术方法

运用ArcGISlO.O加载已经矢量化的枣庄市地图,作为空间分析的底图.导人处理后 带有房价的空间数据库,在ArcGIS中表现为点要素,并转化WGS -84坐标系,使点要素 的坐标与底图坐标相一致.对飞出底图之外的点进行适当修改,将修改后的点要素与底 图进行空间相交分析,删除偏差较大的点.

图1.获取的二手房空间数据

对处理后的点要素进行叠加、地形转栅格、核密度等空间分析.

.102 .

唐承佳,林真真,付珊珊基于

python爬虫数据的奉庄市二手房价空间分析

2

赛庄市二手住房小区均价空间分析

2. 1 地形转栅格分析

ArcGIS中的地形转栅格是一种插值分析方法,这种分析方法是利用迭代有限差分插

值技术.在运算过程中进行优化,使得表面呈现出一定的连续性,类似于局部差值分析的 连续行,在实际应用中这种分析方法用来拟合DEM,拟合后呈现出一定的地形突变,从 视觉上感受三维立体效应[4].

对相交处理后的点图层进行地形转栅格分析,输入经纬度坐标作为X Y值,X Y在 同一平面内,其中Z值导人空间数据数据库中的小区二手住房小区均价作为高程数据, 不同的房价代表不同的高程数据,设置容差为5.0和200.0.(如图2)

< VALUE*

■ J.KNl47B»» ' «,04U7ni7

■•.(HUTW

t -

□ 1SU6IJ77 -■ 10,S21j05WS - UmU4t49

7S&24H-14.9H4410;

MM410t

图2.赛庄市二手房价空间分布栅格分析

图中不同的灰色梯度分别代表不同的小区二手住房均价,颜色梯度差别不明显,表 明枣庄市二手住房小区均价各区县相差不大,仅在枣庄市南部的台儿庄古城区出现了一 个明显的灰度梯度色区,表明该位置的二手住房小区均价与整个枣庄市相比具有显著的差异.

2. 2 核密度分析

利用核密度分析工具对其周围邻域范围中的密度进行要素计算.核密度分析不仅可 以计算点要素的密度,同样也适用于线要素密度的计算[5 ].

对枣庄市小区二手房均价进行点要素的核密度计算,利用密度分析算出每一个将要 输出的栅格像元周围的点要素的密度.核密度分析可理解为在每一个要计算的点上方都 存在着一个较为平滑的曲面,其中在进行搜索半径仅仅允许使用圆形领域,这个平滑的 曲面在点位置处其表面的值达到最大,当点与点之间的距离的增大时其表面值也会缓缓 下降,而当所要搜索的半径等于点的距离时,此时在该位置处的表面值等于零[6].

在进行操作时,通常情况下,进行建立的平滑的曲面单位一般条件下由所输入的点 要素数据决定的,也可以在制图输出过程中自行设定.若使用面积单位,则需要在计算中 将所得到的像元密度乘上相对应的因子.

加大半径不会使计算所得的密度值产生很大变化.虽然更大的邻域范围内将包括更 多的点,但计算密度时点数将除以更大的面积.更大的半径主要影响是计算密度时需要 考虑到更多的点,而这些点可能距栅格像元更远[7 ].

.103 .

枣庄学院学报

2018年第5期

在ArcGIS中,利用空间分析工具中的核密度分析,以处理后的点要素为对象,进行 点要素的核密度计算与分析,设置默认搜索半径参数,生成核密度图(如图3 ),整体颜色 梯度一致,表明枣庄市二手住房小区7整体情况相差不大,但是其中有三个小区颜色梯 度具有显著差异性,分别位于市中区、滕州市、薛城区,说明此三处的二手住房小区交易 较热,分布较为集中.

B從度

<1>

□0-23,17725

□ 23,17725001 -46.3.5□ 46,3.50001 ■ 69,531.75 口 69.531.75001 -92709■ 92.709,00001 *115,886^5■ 11S.886^S01 -139.063.S■ 139.063.5001 -162^40.75■ 162^40.7501 -185,418■ 18S.4ia〇001 - 208,S9S^5

图3.赛庄市二手房价空间分布核密度分析

2. 3 叠加分析

叠加分析可以实现多种数据集的要素合并,形成一-新的要素.在实际应用中一般 是叠加分析与其他空间分析结合使用.釆用要素叠加方法将枣庄市内的基础设置要素 (路网、水系、商业中心、学校、医院等)与核密度分析得到的图层进行叠加分析^].综合解 释地形栅格转换出现分异的原因以及出现三个核区的影响因素.叠加分析效果如图4.

图4.枣庄市二手房价空间分布与基础设施叠加分析

3

枣庄市二手住房小区均价空间分布特征及其影响因素

3. 1 空间分布特征

枣庄市二手住房小区均价总体呈现“一个极核”的分布格局,多个中心发展趋势显

• 104 •

唐承佳,林真真,付珊珊基于

python爬虫数据的奉庄市二手房价空间分析

现.从專庄市地形转栅格图中可以看出,枣庄市滕州、薛城、市中均有不规贝!J的中心发展. 其中滕州市内的中心大体沿省道、乡道延伸方向延伸,表明滕州市内的二手住房小区均 价,受道路的影响较为明显;薛城区二手住房小区均价较高的地方多临近机构和学 校;市中区内中心发展其周围的基础设施都较完善;台儿庄东南部出现一个极核,以台儿 庄古城为中心的极核是全枣庄市内房价最高的地方,房价甚至超过1万元.

枣庄市二手住房小区房源呈现“一个中心,四个次中心”从枣庄市的核密度图中可以 看出,市中区二手住房小区房源有一-明显的中心,市中因其为老城人口最多,此处的二 手房最受欢迎,在滕州、薛城、峄城、台儿庄区分另!J出现不同范围的次中心,其中薛城区的 次中心呈现出明显的不规贝U.

3.2 影响因素

住宅价格的空间分布受多种因素的共同影响.结合零庄市二手住房小区市场的实际 情况,发现其二手住房小区均价空间分布影响较大的因素有4个:交通情况、基础设施条 件、学校和机构、景区.

在国道省道乡道沿线等交通较为发达的地方,沿交通线路分布的小区方便市民上下 班,是市民首选的房源,导致二手住房小区均价普遍较高.

在通达度较高的市区,交通情况不是影响二手住房小区均价的主要因素,市民大多 愿意选择基础设施较为完善的小区,此时靠近公园、银行、商厦、超市、餐饮等的小区均价 普遍较高.

随着枣庄市新城的开发,学校和机构的搬迁,有一大部分人搬至新城,这些人包 括公务员、陪读学生家长和小商贩等.为了工作方便,这部分人多选择居住在交通较 为便利的机构、学校旁边,使得薛城区内机构、学校附近的二手住房小区均价上 涨较快.

台儿庄景区是国家AAAAA级旅游景区,游客来自全国各地,由于景区的客流量增 多,管理景区的工作人员增多,为了工作方便他们多选择就近居住在景区附近,加之游客 的短时间居住,使得以景区为中心的二手小区住房均价普遍较高.

4

结论

利用GIS空间分析方法得出枣庄市二手住房小区均价呈现“一个极核”多个中心发

展趋势的空间分布格局特征,受到交通情况、基础设施条件、学校和机构的影响,中 心发展呈现不规则分布,台儿庄景区的发展会抬高附近整体房价,出现一\"极核的格局. 枣庄市二手住房小区房源呈现“一个中心,四个次中心一个中心位于建城区较早的市 中区,其余四个次中心分别位于各区县基础设施较为完善的城市建成区.

参考文献

[1 ]王新刚.城市住房价格时空模型分析[D ].河南大学,2015.

[2] 焦耀,刘望保,石恩名.基于多源P0I数据下的广州市商业业态空间分布及其机理研究[J].城市观察,2015(06): 86-96.

[3] 单灵芝,陈旭.枣庄市人居环境与经济发展协调度分析[J].对外经贸,2014(03 ):92 - 94.

[4] 王靖雯,徐淑娟.基于大数据空间分析的青岛市普通住宅价格研究[J].现代经济信息,2016( 12 ):486-487.[5] 段堃.基于空间视角的长三角区域商品住宅价格影响因素分析[D].西南交通大学,2015.

[6 ]陈震.基于GIS的昆明商品住宅房价分布及影响因素研究[D ].云南财经大学,2012.[7 ]王勇.不同区位房价收益率分形分布下的投资VaR模型有效性研究[D ].深圳大学,2016.[8 ]容丽阵.基于GIS和Hedonic Model二手房价格空间分布及原因探析[D ].昆明理工大学,2014.

[责任编辑:刘广德]

.105 .

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- igat.cn 版权所有 赣ICP备2024042791号-1

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务