HTML操作 - 处理 HTML和XML的库。

分类 - 设置更多关注

排序

按热度排序
286 10.9k 703

R 该库旨在尽可能简单直观地解析HTML(例如,抓取网页)
 
9.0 1.2
41 844 43

H httptools是nodejs HTTP解析器的Python绑定
 
2.8 0.0
45 842 240

H html5lib:一个兼容标准的 HTML 文档和片段解析及序列化库
 
2.7 0.5
  9天前
11 587 19

H html5-parser一个用于Python基于C的快速HTML5解析
 
2.0 0.0
  7月前
13 470 73

J 将HTML转换为Markdown的工具,用Python编写
 
1.6 0.0
  1年前
13 470 73

T tomd:将HTML转换为Markdown
 
1.6 0.0
  1年前
28 464 64

U untangle:将XML文档转换为Python对象,使其可以方便的访问
 
1.5 0.0
23 324 87

M MarkupSafe:为Python 实现 XML/HTML/XHTML 标记安全字符串
 
1.0 5.8
  9天前
13 298 14

S 使用Modest引擎(快速HTML5解析器和CSS选择器)的一个Python绑定
 
1.0 0.0
105 3.5k 312

M 一个用于自动与网站交互的Python库, MechanicalSoup自动存储和发送cookie,遵循重定向,并可以跟随链接并提交表单。
 
0.6 0.5
104 4k 386

X xmltodict:像处理 JSON 一样处理 XML
 
0.5 0.2
  1月前
64 1.2k 228

D generator.py包含主脚本。 它使用grammar.py作为库,并包含DOM fuzzing的其他辅助程序代码
 
0.5 0.0
  5月前
4 138 2

H Harser:对HTML解析和构建XPath的简单方法
 
0.5 0.0
  3年前
4 121 12

H 这个包提供了一组函数来度量网页之间的相似度
 
0.4 0.0
  4月前
67 1.9k 156

P pyquery:一个解析 HTML 的库,类似 jQuery
 
0.3 0.0
  4月前
77 1.7k 518

X xhtml2pdf:HTML/CSS 转 PDF 工具
 
0.2 0.0
41 1k 64

D Dominate是一个Python库,用于使用优雅的DOM API创建和处理HTML文档。 它使您可以非常简洁地用纯Python编写HTML页面,从而无需学习另一种模板语言,并且可以利用Python的更强大功能。
 
0.1 0.0
3 24 3

将图像转换成html文件
 
0.1 0.0
  2月前
12 100 16

D Demiurge:基于PyQuery 的爬虫微型框架
 
0.0 0.0