如何获取沪深股市历史数据并入库

如何获取沪深股市历史数据并入库采用Tushare大数据社区的数据接口,免费撸数据

大家好,又见面了,我是你们的朋友全栈君。

作为一个技术男,一开始总想着怎么去爬数据。然而一旦发现有免费的数据接口时,瞬间感觉爬来的不香了。。。

利用Tushare大数据社区的数据接口:
1、注册用户,并完善资料,以获取最低的积分要求;
2、获取token,作为获取数据的唯一凭证;
3、利用python脚本采集入库。
能力要求:
1、会使用mysql数据库
2、熟悉python基础语法

一、注册用户

(1)注册的操作很简单,参考平台的说明,注册完成后可获得100积分,链接如下:
https://tushare.pro/document/1?doc_id=38

(2)点击右上角的“个人主页”,然后点“个人资料”标签页,完善基本资料后可获得20积分。这样就能满足最低120积分要求。
(具体图示略)

二、获取token

在采集数据前,需要提供token进行身份认证,获取方法也很简单,参考平台说明:
https://tushare.pro/document/1?doc_id=39

三、获取数据并入库

接下来主要就是一套python代码的事了,下面以采集最近一年内日线数据为例做详细说明。

(1)连接自己的mysql库,创建目标表stock

CREATE TABLE `stock`  (
  `ts_code` varchar(10) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL COMMENT '股票代码',
  `trade_date` varchar(8) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL COMMENT '交易日期',
  `pri_open` decimal(18, 2) NULL DEFAULT NULL COMMENT '开盘价',
  `pri_high` decimal(18, 2) NULL DEFAULT NULL COMMENT '最高价',
  `pri_low` decimal(18, 2) NULL DEFAULT NULL COMMENT '最低价',
  `pri_close` decimal(18, 2) NULL DEFAULT NULL COMMENT '收盘价',
  `pri_close_pre` decimal(18, 2) NULL DEFAULT NULL COMMENT '昨收价',
  `am_chg` decimal(18, 2) NULL DEFAULT NULL COMMENT '涨跌额',
  `pct_chg` decimal(18, 2) NULL DEFAULT NULL COMMENT '涨跌幅(未复权)',
  `vol` int NULL DEFAULT NULL COMMENT '成交量(手)',
  `amount` decimal(18, 2) NULL DEFAULT NULL COMMENT '成交额(千元)',
  INDEX `idx_sdl_code`(`ts_code`) USING BTREE,
  INDEX `idx_sdl_date`(`trade_date`) USING BTREE
) ENGINE = InnoDB CHARACTER SET = utf8 COLLATE = utf8_general_ci ROW_FORMAT = Dynamic;

(2)“python脚本上半部分”,导入包,提供token和mysql数据信息,注意第9行中,数据库的用户名、密码、ip、端口号、和数据库名要填全

import pymysql
import datetime
import tushare as ts
import pandas as pd
from sqlalchemy import create_engine

# 连接 tushare,获取行情数据
pro = ts.pro_api('xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx')
engine = create_engine("mysql+pymysql://root:mima@192.168.99.99:3306/db2?charset=utf8")

# 打开数据库连接
db = pymysql.connect(host='192.168.99.99', port=3306, user='root', passwd='feng', db='db2', charset='utf8')

(3)“python脚本下半部分”,编写循环,每循环一次获取一天的数据,如果当天不是交易日则获取的数据为空。其中调用接口部分只有19和20两行代码。

# 获取当前日期
now = datetime.datetime.now()

# 使用 cursor() 方法创建一个游标对象 cursor
cursor = db.cursor()

# 循环365次,每次生成当前日期,作为入参获取当天数据
for i in range(1,366):

    delta = datetime.timedelta(days=i)
    n_days = now - delta
    rq = n_days.strftime('%Y%m%d')

    # 清空临时表
    sql1 = "truncate table stock_daily_basic"
    cursor.execute(sql1)

    # (Tushare数据接口)获取数据,然后插入到数据库临时表stock_daily_basic
    df = pro.daily(trade_date=rq)
    df.to_sql(name='stock_daily_basic',con=engine,if_exists='append',index=False)

    # 从临时表插入到目标表
    sql2 = "insert into stock select * from stock_daily_basic"
    cursor.execute(sql2)

    db.commit()

# 关闭数据库连接
db.close()

(4)连接mysql库,查看获取的数据
在这里插入图片描述

四、补充说明

以上只是按我个人习惯列举的简单例子,Tushare平台足够丰富,基本能支持大家的各种数据需求。
平台特点:

  • 拥有丰富的数据内容,如股票、基金、期货、数字货币等行情数据,公司财务、基金经理等基本面数据
  • SDK开发包支持语言,同时提供HTTP Restful接口,最大程度方便不同人群的使用
  • 提供多种数据储存方式,如Oracle、MySQL,MongoDB、HDF5、CSV等,为数据获取提供了性能保证
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/152725.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • mysql语句大全及例子_SQL语句大全实例教程.pdf[通俗易懂]

    mysql语句大全及例子_SQL语句大全实例教程.pdf[通俗易懂]SQL语句大全实例教程无论您是一位SQL的新手,或是一位只是需要对SQL复习一下的资料仓储业界老将,您就来对地方了。这个SQL教材网站列出常用的SQL指令,包含以下几个部分:♦SQL指令:SQL如何被用来储存、读取、以及处理数据库之中的资料。♦表格处理:SQL如何被用来处理数据库中的表格。♦进阶SQL:介绍SQL进阶概念,以…

    2022年5月20日
    32
  • 单模光纤和多模光纤的波长_用立式光学计测量轴径结论

    单模光纤和多模光纤的波长_用立式光学计测量轴径结论熔接必备住友82C菲尼特熔接教程首先是介绍下多模光纤和单模光纤区别:1、多模光纤是光纤通信最原始的技术,这一技术是人类首次实现通过光纤来进行通信的一项革命性的突破。2、随着光纤通信技术的发展,特别是激光器技术的发展以及人们对长距离、大信息量通信的迫切需求,人们又寻找到了更好的光纤通信技术—-单模光纤通信。3、光纤通信技术发展到今天,多模光纤通信固有的很多局限性愈发显得突出:①多…

    2022年8月30日
    3
  • 【算法千题案例】每日LeetCode打卡——93.宝石与石头[通俗易懂]

    【算法千题案例】每日LeetCode打卡——93.宝石与石头[通俗易懂]算法题打卡:宝石与石头。没有特别幸运,那么请先特别努力,别因为懒惰而失败,还矫情地将原因归于自己倒霉。所以说,树倒了,没有一片雪花是无辜的

    2022年7月24日
    9
  • python recvfrom函数详解_UDP sendto和recvfrom使用详解「建议收藏」

    python recvfrom函数详解_UDP sendto和recvfrom使用详解「建议收藏」在网络编程中,UDP运用非常广泛。很多网络协议是基于UDP来实现的,如SNMP等。大家常常用到的局域网文件传输软件飞鸽传书也是基于UDP实现的。本篇文章跟大家分享linux下UDP的使用和实现,主要介绍下sendto()和recvfrom()两个函数的使用,以及INADDR_ANY的说明,并在最后展示了一个经过自己测试可用的UDPServer和UDPClient的代码示例。头文件#inclu…

    2022年7月23日
    8
  • linux软链接的创建、删除和更新[通俗易懂]

    linux软链接的创建、删除和更新[通俗易懂]大家都知道,有的时候,我们为了省下空间,都会使用链接的方式来进行引用操作。同样的,在系统级别也有。在Windows系列中,我们称其为快捷方式,在Linux中我们称其为软链接(基本上都差不多了,其中可能有差别,但是那又怎样呢?我们只要实现我们的效果,谁会有精力去管它茴香的茴字有几种写法呢?)。Windows老姑娘的那几个姿势这里就不赘述了,我们今天主要说下Linux中的茴香的茴字怎么写。

    2022年6月12日
    28
  • Idea激活码永久有效Idea2020.1.1激活码教程-持续更新,一步到位「建议收藏」

    Idea激活码永久有效Idea2020.1.1激活码教程-持续更新,一步到位「建议收藏」Idea激活码永久有效2020.1.1激活码教程-Windows版永久激活-持续更新,Idea激活码2020.1.1成功激活

    2022年6月17日
    25

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号