Python在VSCode环境抓取TuShare数据存入MongoDB环境搭建
本文出自:https://www.cnblogs.com/2186009311CFF/p/11573094.html
总览
此文分为5个部分
第一:Anaconda(下载和安装)
第二:VSCode(下载和安装)
第三:mongoDB(下载和安装)
第四:install 必要的python包
第五:联合运行
1.Anaconda
1.1引入目的
自由切换python版本
1.2下载文件地址
清华大学镜像网:https://mirror.tuna.tsinghua.edu.cn/help/anaconda/
(下载最新版即可)
1.3安装注意点
为了方便,安装时勾选加入环境变量,不然后面还要手动添加环境变量

1.4检测是否安装成功
Conda env list
Conda activate 安装目录

1.5自由切换python版本
(该切换版本步骤,刚安装时,可省略)
1.5.1 创建版本目录:Conda create -n 文件夹名称 python版本

1.5.2 选择Y

1.5.3 激活版本或关闭该版本

2.VSCode
2.1引入目的
可扩展性强,且免费(主要是PyCharm不免费)
2.2下载文件地址
VSCode官网: https://code.visualstudio.com/Download
2.3设置
文件-首选项-设置


2.4检测是否安装成功
注意: 若vscode一直打开,请重启一下vscode,再运行以下测试程序
选择“文件夹”,打开含有测试*.py文件的文件夹,右键,run code (下方打印出了代码的文字,则安装成功)

3.Mongodb
3.1引入目的
财务字段多且不固定,这个可延展性好
3.2下载文件地址
Mongodb官网: https://www.mongodb.com/download-center/community?jmp=docs
选择服务端下载,界面如下图:

创建管理员用户: db.createUser({user: "test1", pwd: "test1", roles: [{role: "root", db: "admin"}]})
mongo 数据库名 -u 用户名-p 密码
3.3检测是否安装成功
打开cmd命令行输入如下相应命令,有相应的图片类似结果,则成功
mongo show dbs use 数据库名 插入测试数据 查询测试数据


4.install 必要的python包
4.1 方法一:在vscode的终端模块输入相应的命令

4.2 方法二:Cmd 里的命名行

5. 联合运行
5.1 编辑代码,运行
注意:我这边是python3的代码,之前百度连接mongoDB很多是pymongo.Connection,其实要pymongo.MongoClient,这里提醒一下。
import pymongo
import json
import tushare as ts
#import logging
#mport os #logging.basicConfig(filename=os.path.join(os.getcwd(),'log.txt'),level=logging.DEBUG) client = pymongo.MongoClient('127.0.0.1', port=27017)
db=client.pytestdb
collection=db.test_col def basic_usa():
data= ts.get_hist_data('600038',start='2018-01-05',end='2018-01-09')
print(data)
#logging.debug(json.loads(data.to_json(orient='records')))
collection.insert(json.loads(data.to_json(orient='records'))) basic_usa()
#
#print(df)
#client.db.test.insert(json.loads(df.to_json(orient='records')))
5.2 vscode 有如下输出结果:

5.3检测是否插入数据库成功
查询相应数据库和表,有如下图结果,则表明联合运行成功。

参考链接
Anaconda安装:
https://blog.csdn.net/yctjin/article/details/80184988
https://blog.csdn.net/vinkim/article/details/81546333
https://blog.csdn.net/weixin_42014622/article/details/94870354
https://www.jianshu.com/p/f10fb1a4cc87 (切换版本)
https://blog.csdn.net/ITLearnHall/article/details/81708148
Mongodb安装:
https://blog.csdn.net/qq_37546891/article/details/83892428
Tushare使用:
https://blog.csdn.net/new_stranger/article/details/83346258
https://blog.csdn.net/yagamil/article/details/77603600
https://blog.csdn.net/m0_37863551/article/details/82914729
VSCode 调试:https://blog.csdn.net/Marvellor/article/details/80877201
Pycharm使用:
https://www.cnblogs.com/honkly/p/8536669.html
微信免密支付:https://pay.weixin.qq.com/wiki/doc/api/pap_sl_jt_v2.php?chapter=20_100&index=12
Python在VSCode环境抓取TuShare数据存入MongoDB环境搭建的更多相关文章
- Python 逆向抓取 APP 数据
今天继续给大伙分享一下 Python 爬虫的教程,这次主要涉及到的是关于某 APP 的逆向分析并抓取数据,关于 APP 的反爬会麻烦一些,比如 Android 端的代码写完一般会进行打包并混淆加密加固 ...
- 手把手教你用python打造网易公开课视频下载软件3-对抓取的数据进行处理
上篇讲到抓取的数据保存到rawhtml变量中,然后通过编码最终保存到html变量当中,那么html变量还会有什么问题吗?当然会有了,例如可能html变量中的保存的抓取的页面源代码可能有些标签没有关闭标 ...
- [Python爬虫] 之八:Selenium +phantomjs抓取微博数据
基本思路:在登录状态下,打开首页,利用高级搜索框输入需要查询的条件,点击搜索链接进行搜索.如果数据有多页,每页数据是20条件,读取页数 然后循环页数,对每页数据进行抓取数据. 在实践过程中发现一个问题 ...
- [Python爬虫] 之四:Selenium 抓取微博数据
抓取代码: # coding=utf-8import osimport refrom selenium import webdriverimport selenium.webdriver.suppor ...
- iOS开发——网络实用技术OC篇&网络爬虫-使用青花瓷抓取网络数据
网络爬虫-使用青花瓷抓取网络数据 由于最近在研究网络爬虫相关技术,刚好看到一篇的的搬了过来! 望谅解..... 写本文的契机主要是前段时间有次用青花瓷抓包有一步忘了,在网上查了半天也没找到写的完整的教 ...
- iOS开发——网络使用技术OC篇&网络爬虫-使用正则表达式抓取网络数据
网络爬虫-使用正则表达式抓取网络数据 关于网络数据抓取不仅仅在iOS开发中有,其他开发中也有,也叫网络爬虫,大致分为两种方式实现 1:正则表达 2:利用其他语言的工具包:java/Python 先来看 ...
- iOS—网络实用技术OC篇&网络爬虫-使用java语言抓取网络数据
网络爬虫-使用java语言抓取网络数据 前提:熟悉java语法(能看懂就行) 准备阶段:从网页中获取html代码 实战阶段:将对应的html代码使用java语言解析出来,最后保存到plist文件 上一 ...
- 用C++实现网络编程---抓取网络数据包的实现方法
一般都熟悉sniffer这个工具,它可以捕捉流经本地网卡的所有数据包.抓取网络数据包进行分析有很多用处,如分析网络是否有网络病毒等异常数据,通信协议的分析(数据链路层协议.IP.UDP.TCP.甚至各 ...
- iOS开发——网络实用技术OC篇&网络爬虫-使用java语言抓取网络数据
网络爬虫-使用java语言抓取网络数据 前提:熟悉java语法(能看懂就行) 准备阶段:从网页中获取html代码 实战阶段:将对应的html代码使用java语言解析出来,最后保存到plist文件 上一 ...
随机推荐
- python+selenium调用JavaScript
有些浏览器的页面操作,不能依靠WebDriver提供的API来操作,需要借助JavaScript脚本. webdriver提供了execute_script()方法来执行JavaScript代码. f ...
- CentOS7修改内核启动顺序
CentOS7修改内核启动顺序: 1.首先查看当前系统有几个内核 cat /boot/grub2/grub.cfg |grep menuentry 2.查看当前默认内核 grub2-editenv ...
- 在Docker中部署ASP.NET Core 2.2
⒈新建一个ASP.NET Core2.2 Web程序 因为Windows的Docker和Linux的Docker有所不同,本次测试采用的是Linux的Docker,因此没有勾选启用Docker支持. ...
- SVN随笔记录(一)
svn是版本控制系统 为何使用svn? ~团队在开发同一个项目时对项目进行模块划分,在第一阶段结束后进行部分整合时,提交至服务器上合并. ~多人对同一版本的同一代码进行修改后,合并时会出现冲突,此是需 ...
- linux连接Windows系统之项目连接
在桥接模式下 在linux内需要设置 防火墙关闭 在Windows中连接 linux的ip连接 ***项目 在linux中命令行输入setup-->防火墙配置-->空格-->确定-- ...
- python-queue队列-生产者消费者
import threading,time import queue q = queue.Queue(maxsize=10) def Producer(name):#生产者 count=1 while ...
- 搞懂Redis复制原理
前言 与大多数db一样,Redis也提供了复制机制,以满足故障恢复和负载均衡等需求.复制也是Redis高可用的基础,哨兵和集群都是建立在复制基础上实现高可用的.复制不仅提高了整个系统的容错能力,还可以 ...
- [Nest] 05.nest之数据库
数据库 Nest 与数据库无关,允许您轻松地与任何 SQL 或 NoSQL 数据库集成.根据您的偏好,您有许多可用的选项.一般来说,将 Nest 连接到数据库只需为数据库加载一个适当的 Node.js ...
- 网络信息统计netstat|ss|ip
1:netstate[弃用] netstat的作用: 需求 原命令 新命令 1:网络连接 netstat -a ss 2:路由表 netstat -r ip route 3:统计接口 netstat ...
- zookeeperAPI的常用方法
zookeeper支持三种部署方式: 1 单机 2 集群 3 伪集群 删除节点 zkClient.delete(path);