Beautiful Soup

来自Local Chinese Wikipedia
跳转到导航 跳转到搜索

package.lua第80行Lua错误:module 'Module:CGroup/core' not found

页面Module:Infobox/styles.css没有内容。

Beautiful Soup
原作者Leonard Richardson
当前版本Template:Software version
源代码库页面Template:Plainlist/styles.css没有内容。Module:EditAtWikidata第29行Lua错误:attempt to index field 'wikibase' (a nil value)
编程语言Python
引擎页面Template:Plainlist/styles.css没有内容。
    脚本错误:没有“Wd”这个模块。
Module:EditAtWikidata第29行Lua错误:attempt to index field 'wikibase' (a nil value)
类型HTML解析库、网络数据采集
许可协议Python软件基金会许可证 (Beautiful Soup 3及以前)
MIT许可证(Beautiful 4及以后)[1]
网站www.crummy.com/software/BeautifulSoup/
脚本错误:没有“Template wrapper”这个模块。

Beautiful Soup是一个Python包,功能包括解析HTMLXML文档、修复含有未闭合标签等错误的文档(此种文档常被称为tag soup)。这个扩展包为待解析的页面建立一棵,以便提取其中的数据,这在网络数据采集时非常有用。[1]

在2021年,Python 2.7的官方支持终止,BeautifulSoup发行版4.9.3是支持Python 2.7的最后版本[2]

示例代码[编辑]

#!/usr/bin/env python3
# Anchor extraction from HTML document
from bs4 import BeautifulSoup
from urllib.request import urlopen
with urlopen('https://en.wikipedia.org/wiki/Main_Page') as response:
    soup = BeautifulSoup(response, 'html.parser')
    for anchor in soup.find_all('a'):
        print(anchor.get('href', '/'))

参见[编辑]

参考资料[编辑]

  1. 1.0 1.1 package.lua第80行Lua错误:module 'Module:Citation/CS1/Identifiers' not found
  2. package.lua第80行Lua错误:module 'Module:Citation/CS1/Identifiers' not found

package.lua第80行Lua错误:module 'Module:Navbar/configuration' not found