1 Star 0 Fork 0

Achillea/grab

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
文件
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
1.py 1.54 KB
一键复制 编辑 原始数据 按行查看 历史
Achillea 提交于 2017-02-16 10:11 . 1.py 更新操作测试
#!usr/bin/python
#coding=utf-8
import sys
import re
import time
import urllib.request
import chardet
import ltmex.ltmcode
import ltmex.ltmgrab
import ltmex.ltmsearch
import ltmex.ltmFile
import urllib.parse
import string
name = 1
def saveFile(data,path):
f = open(path, 'w')
f.write(data)
f.close()
def getImgByUrl(url):
global name
imglist = ltmex.ltmgrab.grabHtml(pattern =ltmex.ltmgrab.patHttpVideo,url= url, headers=ltmex.ltmgrab.defaultHeader)
# print(imglist)
for img in imglist:
print(img)
# saveFile(img, "c:/t/%s.txt" %(name))
# ltmex.ltmFile.writeFile(img, "c:/t/%.mp4" %(name))
ltmex.ltmFile.downloadFile(img[0], 'c:/t/%s.%s' % (name,img[1]))
# urllib.request.urlretrieve(img[0], 'c:/t/%s.%s' % (name,img[1]) )
name += 1
'''
u = 'http://www.baidu.com/s?wd=大&rsv_bp=0&rsv_spt=3&rsv_n=2&inputT=6391'
u =urllib.parse.quote(u,safe=string.printable)
print(u)
linklist = ltmex.ltmgrab.grabHtml('href="(https*://www.baidu.com/link\?[^"]+?)"', u)
'''
#linklist = ltmex.ltmgrab.grabHtml('href="(https*://www.baidu.com/link\?[^"]+?)"', "http://www.baidu.com/s?wd=谷%20磁&rsv_bp=0&rsv_spt=3&rsv_n=2&inputT=6391")
linklist = ltmex.ltmsearch.searchBaidu(['小视频'], num=200)
print(linklist)
for link in linklist:
getImgByUrl(link)
#getImgByUrl('http://www.baidu.com/link?url=UKC-gQlc6ULHiYQAOHzb58ltnoKHrSufyqpxELPE6a1I6kilQLDjUPhphLhG05W4d7NYJnRmhWIVZ_fvBXT6-SxZrA8OVMR6TtMhTTmJxsGL0FT6R6DNoyo-N6Ll5UNk')
Loading...
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化
Python
1
https://gitee.com/achillea/grab.git
[email protected]:achillea/grab.git
achillea
grab
grab
master

搜索帮助