您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. python正则进行数据处理

  2. python利用正则re模块等对数据进行替换等操作,或者替换html标签
  3. 所属分类:Python

  1. python利用re,bs4,requests模块获取股票数据

  2. 主要介绍了python利用re,bs4,requests模块获取股票数据,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
  3. 所属分类:其它

    • 发布日期:2020-09-18
    • 文件大小:103424
    • 提供者:weixin_38714532
  1. Python中正则表达式详解

  2. Python 的 re 模块(Regular Expression 正则表达式)提供各种正则表达式的匹配操作,Python 会将正则表达式转化为字节码,利用 C 语言的匹配引擎进行深度优先的匹配。
  3. 所属分类:其它

    • 发布日期:2020-10-19
    • 文件大小:83968
    • 提供者:weixin_38528459
  1. python 利用正则表达式提取特殊信息

  2. 1、删除字符串中的 Python注释 案例: import re time = "2020-01-01 # 这是一个日期" num = re.sub(r'#.*$', "", time)#以#为分隔,去掉后面的信息 print("这个时间是:", num) 结果: 这个时间是: 2020-01-01 2、截取某符号前后的内容 案例1: txt = '我的电话是:131-246-XXX19' a = txt.split(':')[0]#0表示符号前 b = txt.split(':')[1
  3. 所属分类:其它

    • 发布日期:2020-11-21
    • 文件大小:49152
    • 提供者:weixin_38659311
  1. python的正则表达式re模块的常用方法

  2. 1.re的简介 使用python的re模块,尽管不能满足所有复杂的匹配情况,但足够在绝大多数情况下能够有效地实现对复杂字符串的分析并提取出相关信息。python 会将正则表达式转化为字节码,利用 C 语言的匹配引擎进行深度优先的匹配。 复制代码 代码如下: import re print re.__doc__ 可以查询re模块的功能信息,下面会结合几个例子说明。 2.re的正则表达式语法 正则表达式语法表如下: 语法 意义 说明 “.” 任意字符 “^” 字符串开始
  3. 所属分类:其它

    • 发布日期:2020-12-25
    • 文件大小:72704
    • 提供者:weixin_38675797
  1. python利用pandas将excel文件转换为txt文件的方法

  2. python将数据换为txt的方法有很多,可以用xlrd库实现。本人比较懒,不想按太多用的少的插件,利用已有库pandas将excel文件转换为txt文件。 直接上代码: ''' function:将excel文件转换为text author:Nstock date:2018/3/1 ''' import pandas as pd import re import codecs #将excel转化为txt文件 def exceltotxt(excel_dir, txt_dir): with
  3. 所属分类:其它

    • 发布日期:2020-12-25
    • 文件大小:35840
    • 提供者:weixin_38559203
  1. Python利用正则表达式匹配并截取指定子串及去重的方法

  2. 本文实例讲述了Python利用正则表达式匹配并截取指定子串及去重的方法。分享给大家供大家参考。具体如下: import re pattern=re.compile(r'\| (\d+) \| (\d+) \|') numset=set()\nall=''' | 29266795 | 533 | | 29370116 | 533 | | 29467495 | 533 | | 29500404 | 533 | | 29500622 | 533 | | 29515964 | 530 | | 2951
  3. 所属分类:其它

    • 发布日期:2020-12-25
    • 文件大小:35840
    • 提供者:weixin_38736011
  1. python利用ffmpeg进行录制屏幕的方法

  2. 前几天下载了几个视频,但是有两集是一个视频的,偶尔找到了ffmpeg处理视频的方法,它的功能非常强大。因此,分享一下,一起学习。 import subprocess,sys,os import re class CutSplicingVdeio(object): def __init__(self): pass #dercription CutSplicingVdeio this class function def instructions(self): derc
  3. 所属分类:其它

    • 发布日期:2020-12-24
    • 文件大小:37888
    • 提供者:weixin_38694355
  1. Python爬虫实例爬取网站搞笑段子

  2. 众所周知,python是写爬虫的利器,今天作者用python写一个小爬虫爬下一个段子网站的众多段子。 目标段子网站为“http://ishuo.cn/”,我们先分析其下段子的所在子页的url特点,可以轻易发现发现为“http://ishuo.cn/subject/”+数字, 经过测试发现,该网站的反扒机制薄弱,可以轻易地爬遍其所有站点。 现在利用python的re及urllib库将其所有段子扒下 import sys import re import urllib #返回html格式 def
  3. 所属分类:其它

    • 发布日期:2020-12-24
    • 文件大小:166912
    • 提供者:weixin_38712578
  1. python利用urllib实现爬取京东网站商品图片的爬虫实例

  2. 本例程使用urlib实现的,基于python2.7版本,采用beautifulsoup进行网页分析,没有第三方库的应该安装上之后才能运行,我用的IDE是pycharm,闲话少说,直接上代码! # -*- coding: utf-8 -* import re import os import urllib import urllib2 from bs4 import BeautifulSoup def craw(url,page): html1=urllib2.urlopen(url).rea
  3. 所属分类:其它

    • 发布日期:2020-12-23
    • 文件大小:166912
    • 提供者:weixin_38519660
  1. python实现读取excel写入mysql的小工具详解

  2. Python是数据分析的强大利器 利用Python做数据分析,第一步就是学习如何读取日常工作中产生各种excel报表并存入数据中,方便后续数据处理。 这里向大家分享python如何读取excel,并使用Python将数据存入Mysql中,有需要的朋友们一起来看看吧。 背景 需要导入全国高校名录到数据库,从教委网站下到了最新的数据,是excel格式,需要做一个工具进行导入,想试用一下python,说干就干。 库 xlrd : excel读写库 pymysql : mysql数据库驱动
  3. 所属分类:其它

    • 发布日期:2020-12-23
    • 文件大小:72704
    • 提供者:weixin_38606656
  1. python利用正则表达式搜索单词示例代码

  2. 前言 在python中,通过内嵌集成re模块,程序媛们可以直接调用来实现正则匹配。正则表达式模式被编译成一系列的字节码,然后由用C编写的匹配引擎执行。 比如下面的例子,就是用来从一段文字里查找一个单词,如下: 示例代码 import re pattern = 'this' text = 'http://blog.csdn.net/caimouse is great, this is great way!' match = re.search(pattern, text) s = mat
  3. 所属分类:其它

    • 发布日期:2021-01-01
    • 文件大小:41984
    • 提供者:weixin_38706055
  1. python 利用浏览器 Cookie 模拟登录的用户访问知乎的方法

  2. 首先在火狐浏览器上登录知乎,然后使用火狐浏览器插件 Httpfox 获取 GET 请求的Cookie,这里注意使用状态值为 200(获取成功)的某次GET. 将 Cookies 复制出来,注意这一行非常长,不要人为添加换行符。而且 Cookie 中使用了双引号,最后复制到代码里使用单引号包起来。 使用下边代码检验是否是模拟了登录的用户的请求: import requests import re headers = { 'User-Agent': 'Mozilla/5.0 (Windows N
  3. 所属分类:其它

    • 发布日期:2021-01-01
    • 文件大小:96256
    • 提供者:weixin_38639747
  1. python利用re,bs4,requests模块获取股票数据

  2. 今天闲来无聊无意间看到了百度股票,就想着用python爬一下数据,于是就找到了东方财经网,结合这两个网站,写了一个小爬虫,数据保存在文件中,比较简单的示例,就当做用来练习正则表达式和BeautifulSoupl了。 首先页面分析,打开东方财经网股票列表页, 和百度股票详情页 ,右键查看网页源代码, 网址后面的代码就是股票代码,所以打算先获取股票代码,然后获取详情,废话少说,直接上代码吧: import re import requests from bs4 import Beautiful
  3. 所属分类:其它

    • 发布日期:2020-12-31
    • 文件大小:104448
    • 提供者:weixin_38620839
  1. Python利用requests模块下载图片实例代码

  2. 本文主要介绍的是关于Python利用requests模块下载图片的相关,下面话不多说了,来一起看看详细的介绍吧 MySQL中事先保存好爬取到的图片链接地址。 然后使用多线程把图片下载到本地。 示例代码: # coding: utf-8 import MySQLdb import requests import os import re from threading import Thread import datetime header = {'User-Agent': 'Mozilla/5.
  3. 所属分类:其它

    • 发布日期:2020-12-31
    • 文件大小:45056
    • 提供者:weixin_38686187
  1. Python获取当前页面内所有链接的四种方法对比分析

  2. 本文实例讲述了Python获取当前页面内所有链接的四种方法。分享给大家供大家参考,具体如下: ''' 得到当前页面所有连接 ''' import requests import re from bs4 import BeautifulSoup from lxml import etree from selenium import webdriver url = 'http://www.testweb.com' r = requests.get(url) r.encoding = 'gb2312
  3. 所属分类:其它

    • 发布日期:2020-12-30
    • 文件大小:49152
    • 提供者:weixin_38742460
  1. 超详细的python正则表达式,学习这个就够了#附有实例

  2. 正则表达式(Regular Expression)是一种文本模式,包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为”元字符”) 下面主要讲如何利用元字符进行匹配: 元字符 字符 意义 ^ 匹配输入字符串的开始位置 实例: strs = 'hello python' result = re.findall('^python', strs) print(result) result = re.findall('^hello', strs) print(result)
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:58368
    • 提供者:weixin_38636671
  1. Python利用正则表达式实现计算器算法思路解析

  2. (1)不使用eval()等系统自带的计算方法   (2)实现四则混合运算、括号优先级解析 思路:   1、字符串预处理,将所有空格去除   2、判断是否存在括号运算,若存在进行第3步,若不存在则直接进入第4步   3、利用正则表达式获取最底层括号内的四则运算表达式   4、将四则运算表达式进行预处理:表达式开头有负数时,在表达式前加上一个0   5、利用re.split()、re.findall()方法,通过加减符号,对四则运算进行拆分为乘除运算式和数字,并保留对应的位置下标。   6、利用re
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:60416
    • 提供者:weixin_38686080
  1. python抽取指定url页面的title方法

  2. 今天简单使用了一下python的re模块和lxml模块,分别利用的它们提供的正则表达式和xpath来解析页面源码从中提取所需的title,xpath在完成这样的小任务上效率非常好,在这里之所以又使用了一下正则表达式是因为xpath在处理一些特殊的页面的时候会出现乱码的情况,当然这不是xpath的原因,而是页面本身编码,跟utf-8转码之间有冲突所致,这里看代码: # !/usr/bin/python #-*-coding:utf-8-*- ''' 功能:抽取指定url的页面内容中的title
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:40960
    • 提供者:weixin_38661087
  1. python 利用已有Ner模型进行数据清洗合并代码

  2. 我就废话不多说了,直接上代码吧! # -*- coding: utf-8 -*- from kashgari.corpus import DataReader import re from tqdm import tqdm def cut_text(text, lenth): textArr = re.findall('.{' + str(lenth) + '}', text) textArr.append(text[(len(textArr) * lenth):]) return
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:32768
    • 提供者:weixin_38611388
« 12 3 4 5 »