使用抓取同花顺资金流数据

菏泽德阳
山西湖州
宝鸡上海
茂名内江
三亚信阳
长春北海
西安安徽
黄石烟台
沧州湛江
肇庆鹤壁
六安韶关
成都钦州

　　今天我们通过一个例子来介绍python爬取数据的一般步骤，用到的工具包括python的经典模块requests和BeautifulSoup，另外结合刚学习的任务流工具TaskFlow来完成代码开发。
　　我们先来看一下要爬取的数据，网址是http：data。10jqka。com。cnfundsgnzjl，通过chrome的开发者工具分析我们可以比较容易找到后台数据加载网址为
　　http：data。10jqka。com。cnfundsgnzjlfieldtradezdforderdescpage｛pagenum｝ajax1free1
　　其中pagenum的位置为要查询第几页的数据，在网页上看到概念一共有6页数据，所以pagenum取值为16
　　图示1
　　这里有个小技巧，可以先点击图示1左上角的清空按钮，把已经加载的网址先清理掉，然后在原始网页上点第二页，就能看到图片左下角新加载的网址，点开右边Preview看到资金流数据相关的内容，就能确定这个网址是用来加载数据的。
　　在chrome浏览器中输入http：data。10jqka。com。cnfundsgnzjlfieldtradezdforderdescpage1ajax1free1，并打开chrome开发者工具，在网页源码中找到数据所在table标签为
　　。。。
　　lt；tableclassmtablegt；lt；tablegt；
　　抓取数据的完整源码如下
　　importtimeimportrequestsfrombs4importBeautifulSoupfromtaskflowimportenginesfromtaskflow。patternsimportlinearflowfromtaskflow。taskimportTaskREQUESTHEADER｛UserAgent：Mozilla5。0（Macintosh；IntelMacOSX10142）AppleWebKit537。36（KHTML，likeGecko）Chrome78。0。3904。97Safari537。36｝classMoneyFlowDownload（Task）：下载资金流数据数据源地址：http：data。10jqka。com。cnfundsgnzjlBASEURl｛concept：http：data。10jqka。com。cnfundsgnzjlfieldtradezdforderdescpagesajax1free1，｝defexecute（self，bizdate，args，kwargs）：forname，baseurlinself。BASEURl。items（）：爬取数据的存储路径dtpathdatass。csv（bizdate，name）withopen（dtpath，a）asf：记录数据文件的当前位置posf。tell（）f。seek（0）linesf。readlines（）读取文件中的全部数据并将第一列存储下来作为去重依据，防止爬虫意外中断后重启程序时，重复写入相同crawledlistlist（map（lambdaline：line。split（，）〔0〕，lines））f。seek（pos）循环500次，从第一页开始爬取数据，当页面没有数据时终端退出循环foriinrange（1，500）：print（startcrawls，s（name，baseurli））websourcerequests。get（baseurli，headersREQUESTHEADER）soupBeautifulSoup（websource。content。decode（gbk），lxml）tablesoup。select（。Jajaxtable）〔0〕tbodytable。select（tbodytr）当tbody为空时，则说明当前页已经没有数据了，此时终止循环iflen（tbody）0：breakfortrintbody：fieldstr。select（td）将每行记录第一列去掉，第一列为序号，没有存储必要record〔field。text。strip（）forfieldinfields〔1：〕〕如果记录还没有写入文件中，则执行写入操作，否则跳过这行写入ifrecord〔0〕notincrawledlist：f。writelines（〔，。join（record）〕）同花顺网站有反爬虫的机制，爬取速度过快很可能被封time。sleep（1）ifnamemain：bizdate20200214tasks〔MoneyFlowDownload（moneyflowdatadownload）〕flowlinearflow。Flow（thsdatadownload）。add（tasks）eengines。load（flow，store｛bizdate：bizdate｝）e。run（）
　　执行程序后，在dtpath位置已经存储了概念的资金流数据，文件名为20200214concept。csv，内容大致如下：
　　钛白粉，1008。88，6。29，7。68，6。21，1。47，7，金浦钛业，10。04，2。96磷化工，916。833，2。42，37。53，34。78，2。75，28，六国化工，9。97，4。08光刻胶，1435。68，2。40，43。51，44。31，0。80，20，晶瑞股份，10。01，42。99
　　此时就完成了同花顺概念分类的资金流数据的爬取，之后可以每天定时启动任务抓取数据进行分析。

衣服太长怎么挂衣柜衣服太长挂衣柜的确很不方便，可以将衣服折叠一下再挂，一般在打衣柜时，都会给衣柜预留专门挂长衣服的地方，以免后续挂衣服更方便，如果是出租房的话，那就自己买一个可折叠的小衣柜会更好……大闸蟹盖湿毛巾会闷死吗大闸蟹的保鲜时间是比较短的，大多数人都会将大闸蟹放冰箱冷藏保存，这样可以延长大闸蟹的保鲜期。大闸蟹放冰箱冷藏保存也是有一定讲究的，一般是需要盖上湿毛巾的，这样可以保持湿润，避免……留在心中的雾霭秦岭淮河以南，不像北京一样被霾笼罩，这里更多的是较为洁净的雾气，善良且讨喜的。如庐山的云海这是从山野的角度来看。若是放到小城小镇，那么各处的江南一隅肯定是少不了。于……祖国在我心中出门在外，莫要担惊受怕。因为你有一个强大的后盾，叫中国。题记牡丹花一丛一丛地开在阳光下，花自开自落，大片深绿色的叶子，叶脉起伏宛转，像水波回旋。抬头，仰望高大……鲁滨逊漂流记读后感智慧，是一份财宝，倘若在身处困境的时候，打开这份财宝的宝箱，眼前就会出现一条充满光明与希望的道路《鲁滨逊漂流记》讲述的是主人公鲁滨逊因为船只失事而被海浪冲到荒岛上，在荒岛……第一次跳绳每个人生下来都有无数个第一次，第一次哭，第一次笑，第一次写字使我最难忘的是第一次跳绳。在我幼儿园读大班的时候，跳绳120个才达标，有十几个小朋友都有达标，我就不会跳。回到……未来的汽车一转眼，就到了3030年，我是一名伟大的设计师，我发明了一辆特殊的车，你想知道它是什么样吗？大家听我慢慢道来。这不是一辆普通的车，虽然它的外形和普通汽车一样，但是它是由一……酸角树的回忆外公外婆结婚已有50多年了，有两儿两女，母亲是最小的。母亲生下我后便同父亲去外地打工，自然，我便交由我外婆照顾，也深得她疼爱。我与他们在一起生活了9年，老房子前的酸角树便……妈妈的水杯在厨房的桌子上，常年放着一个蓝色的水杯。每次看到那个水杯，我就会想起生病时，妈妈对我无微不至的照顾每次我生病不舒服，妈妈总会端着那个旧旧的杯子，来的我的床前，手里拿着几颗……成长需要承担责任我长高了几厘米，跑去问妈妈我是不是长大了呢？我上了初中，又跑去问妈妈我是不是长大了呢？我脸上长了几粒青春痘，再一次去问妈妈，我是不是长大了呢？可是，妈妈每次都说：不，孩子，你还……生活需要品尝生活丰富多彩，就像一杯茶，只有细细品味，才能领悟到生活的真谛。我就这样不断地品味到生活的美好。电动车行驶到了一个路口，是红灯，讨厌的红灯。看着红灯，我和妈妈默默地等待着。……一张照片光阴似箭，日月如梭，时间如流水一般在我身边穿行。偶然一次打开抽屉，在翻着一本本书时，竟发现了一张充满回忆的照片，它像一把钥匙，打开了我的记忆之门。那是一个周末的清晨，全家……

<<<<<<－>>>>>>

沼气发生泄漏会致人中毒吗沼气是有机物质在厌氧条件下，经过微生物的发酵作用而生成的一种混合气体。沼气，顾名思义就是沼泽里的气体。人们经常看到，在沼泽地、污水沟或粪池里，有气泡冒出来，如果我们划着火柴，可……怀孕多少个月才能乘坐长途车女性怀孕期，也是最需要精心呵护的时期，她们出行所选择的交通工具也需要认真思考是否会对肚子里的宝宝有影响，那么，怀孕多少个月才能乘坐长途车呢？乘坐公交车应预防哪些安全隐患呢？今天……工地安全质量标语集锦有了安全，我们才能以休闲的心情漫步在夕阳西下的田野上、小河边，低声吟唱采菊东篱下，悠然见南山，有了安全，我们才能以坚定的意志去攀登人生的阶梯，放声高歌长风破浪会有时，直挂云帆济……儿童能吃抗生素吗可别在瞎用了家长一般都知道抗生素这个词，也听说了不能滥用抗生素，可孩子得了病，最要紧的是赶快治好，只要药能治病，哪里还顾得上医生和专业人士的忠告。但这是害了孩子。邵逸夫医院副院长、感……为什么油炸花生老人宜不易多吃古人食用花生多生研冲汤或煮食，忌用油炸和火炒而食。《纲目拾遗》记载，有一妇人咳嗽痰多，医生束手不治，下面我们一起来看看为什么油炸花生老人宜不易多吃。有人劝妇人食花生，每日……宝宝洗头时如何防止眼睛进水宝宝的健康是都很关注的，对于给孩子洗澡也是不能忽视的，孩子洗澡也是有很多注意事项的，那么宝宝洗头时如何防止眼睛进水呢？给宝宝洗头和洗澡时，最容易发生的也是最伤害眼睛的情况……高龄产妇预防难产方法难产是临床分娩的一大难题，最痛苦的莫过于产妇本身，当然家人看着也揪心，医生也会碰到难题，胎儿迟迟出不了娘胎也心急。造成产妇难产的原因有多种。那么高龄产妇预防难产方法有哪些呢？下……哪几招可预防骨质疏松综合征骨质疏松综合征是由于年龄增大、内分泌失调、消化吸收功能障碍以及疾病影响等因素，导致骨质（骨密质和骨松质）密度减少、疏松，从而引起骨骼关节疼痛，功能减退，严重时甚至导致骨折的一种……消杀药品溢漏中毒应急方法当外界某化学物质进入人体后，与人体组织发生反应，引起人体发生暂时或持久性损害的过程称为中毒。那么，消杀药品溢漏中毒应急方法呢？下面就让本站小编来介绍吧！消杀药剂中毒处理预……父母房产过户子女哪种方法最划算价高涨，买不起房，甚至连首付也需要父母帮忙，而也有一部分的人选择从父母手里继承房产，这就涉及到过户，那么父母房产过户子女哪种方法最划算呢？下面就一起随本站小编来了解一下吧。……到底哪些原因导致儿童发生肥胖症到底哪些原因导致儿童发生肥胖症？孩子都很要面子，自尊心很强，如果面临肥胖而造成的心理负担，会直接影响到身体的健康成长。青春不留胖疾病不上身很多爸爸妈妈都认为家中青少年的肥……热伤风吃什么药由于四时气不同，人体素质之差异，或是素有痰火郁热在内，热极生风或为风寒所束不得发越，在临床上表现为热证，感受时行病毒者，病邪从表入里，传变迅速，病情急且重，两岁宝宝热伤风吃什么……

友情链接：易事利快生活快传网聚热点七猫云快好知快百科中准网快好找文好找中准网快软网