博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
爬取百度百科
阅读量:4654 次
发布时间:2019-06-09

本文共 484 字,大约阅读时间需要 1 分钟。

1 import urllib.request 2 from bs4 import BeautifulSoup 3 import re 4  5 def main(): 6     response= urllib.request.urlopen('http://baike.baidu.com/view/284853.htm').read() 7     soup = BeautifulSoup(response,'html.parser')#使用python默认的解析器 8     for each in soup.find_all(href = re.compile('view')): 9         print(each.text,'->',''.join(['http://baike.baidu.com/',each['href']]))#join函数明显比+提高10 if __name__=='__main__':11     main()

 

转载于:https://www.cnblogs.com/themost/p/6701757.html

你可能感兴趣的文章
ConcurrentHashMap实现原理及源码分析
查看>>
PowerDesigner 中将Comment(注释)及Name(名称)内容互相COPY的VBS代码
查看>>
浅谈WPF的VisualBrush
查看>>
经常用得到的安卓数据库基类
查看>>
vue element 关闭当前tab 跳转到上一路由
查看>>
4、面向对象
查看>>
[NOI2005]聪聪与可可(期望dp)
查看>>
POJ 3723
查看>>
Elgg网站迁移指南
查看>>
Sublime Text 3 及Package Control 安装(附上一个3103可用的Key)
查看>>
基于uFUN开发板的心率计(一)DMA方式获取传感器数据
查看>>
【dp】船
查看>>
oracle, group by, having, where
查看>>
⑥python模块初识、pyc和PyCodeObject
查看>>
nodejs pm2使用
查看>>
CSS选择器总结
查看>>
mysql中sql语句
查看>>
sql语句的各种模糊查询语句
查看>>
C#操作OFFICE一(EXCEL)
查看>>
【js操作url参数】获取指定url参数值、取指定url参数并转为json对象
查看>>