博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
python爬虫爬取_腾讯位置大数据_人口迁徙图16年至今数据
阅读量:1899 次
发布时间:2019-04-26

本文共 2174 字,大约阅读时间需要 7 分钟。

腾讯位置大数据

我已拿到从16年至今此网站能提供的城市迁徙大数据,请自行确认自己想要的城市此网站是否提供,部分三四线城市不提供

还有一点:网站不提供具体人数,如果需要具体人数的话我有联通的2020年1-6月份的扩样后的具体人数数据
如需数据请加我qq,在我博客的其他文章里可以找到
在这里插入图片描述

爬取简单思路:

1、获取URL
2、遍历所有城市名,遍历从16年至今的日期
3、访问URL,记得捕获异常,不然有可能会断掉

import osfrom datetime import datetime, timedeltaimport requestsfrom utils.read_write import readTxt, writeOneJson, writeCsvfrom utils.time_change import getBetweenDayos.chdir(r'D:\data\腾讯迁徙\城市\\')# 把Txt文件读取成字符串数组lines = readTxt(r'E:\project\python\JacksonProject\baidu\BaiduMap_cityCode_1102.txt')headers = {
"User-agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 " "(KHTML, like Gecko) Chrome/49.0.2623.221 Safari/537.36 SE 2.X MetaSr 1.0"}# 发送请求def requerts_url(url, riqi, type): try: response = requests.get(url, timeout=1000, headers=headers) json = eval(response.text) if json['data']: # data2 = data2.decode("unicode_escape") # writeOneJson(json, '城市' + type + "_北京" + "_" + riqi + ".json") except Exception as e: print(datetime.now()) print(e) print(url) begin_date = datetime.strptime(riqi, "%Y-%m-%d") begin_date += timedelta(days=1) date_change(riqi)city_list = []# 先将数据下载为Json文件def city_range(riqi): # for i in range(n, 367): # 把城市id号和城市名分开 # obj = lines[i].split(',') # city = obj[1].replace('市', '') city = '北京' file = "城市迁出_" + city + "_" + riqi + ".json" if not os.path.exists(file): firsturl = "https://heat.qq.com/api/getLbsMigrateDataByBeijing.php?city=" \ + city + "&direction=1&type=6&date=" + riqi requerts_url(firsturl, riqi, '迁出') file = "城市迁入_" + city + "_" + riqi + ".json" if not os.path.exists(file): firsturl = "https://heat.qq.com/api/getLbsMigrateDataByBeijing.php?city=" \ + city + "&direction=0&type=6&date=" + riqi requerts_url(firsturl, riqi, '迁入')def date_change(date): date_list = getBetweenDay(date) for riqi in date_list: print(riqi) city_range(riqi) # writeCsv(city_list, 'E:\project\python\JacksonProject\spider\city.csv')if __name__ == '__main__': date_change('2016-01-01')

转载地址:http://dugdf.baihongyu.com/

你可能感兴趣的文章
Eclipse 简便设置
查看>>
Bootstrap修改caret大小
查看>>
适应大分辨率显示屏操作
查看>>
前端技巧:如何让一个div 在另一个div上面显示,却不会影响下一个div的位置?
查看>>
前端技巧:echarts中国地图外边框设置阴影投影效果------荧光效果 随笔
查看>>
前端技巧:echarts中国地图外边框设置阴影投影效果------荧光效果 (2) 带边框 随笔
查看>>
随笔:简单的蒙版加载页面实现
查看>>
处理echarts地图省份坐标重叠的方法
查看>>
获取浏览器可见窗口大小(转载)
查看>>
给文字加一个渐变色
查看>>
使用网格在父元素中水平和垂直地居中定位子元素
查看>>
Box-sizing reset
查看>>
underscore学习笔记一
查看>>
用纯css做一个圆
查看>>
清除浮动Clearfix
查看>>
Elements in iteration expect to have 'v-bind:key' directives问题
查看>>
leetcode -462. Minimum Moves to Equal Array Elements II
查看>>
30分钟彻底弄懂flex布局(本文转自腾讯云加社区,自己收藏学习)
查看>>
谷歌浏览器针对http强制转换为https的问题
查看>>
对vue 键盘回车事件的实例讲解(收藏)
查看>>