发布于 2017-02-27 23:48:59 | 137 次阅读 | 评论: 0 | 来源: 网友投递
Apache Any23 web服务和命令行工具
Apache Anything To Triples (Any23) 是一个库、web服务和命令行工具用来从微格式、RDF、为数据、RDF/XML、Turtle、N-Tripes 和 Quards)中抽取结构化数据。
目前支持以下格式:
RDF/XML、Turtle、Notation 3
RDFa
Microformats1、Microformats2
JSON-LD
HTML5 Microdata
CSV
Vocabularies
YAML
部分更新内容:
Sub-task
大修 README.txt
Task
更新 OpenRDF Sesame 至 2.7.0 版本
解决与 1.1#1 RC 的问题
Improvement
将命令行工具拆分为单独的模块
向 HTMLMetaExtractor 添加缺少的 <meta> 元素属性
实施 Microformats2
将 Open Graph Protocol 和 Facebook 前缀添加到 Popular.prefix
更新至 Tika 1.7
在数据提取文档源示例中的小错字
Any23 不在 JDK1.8 下构建
更多改进和 bug 修复,请查看完整更新日志。
下载地址:
http://any23.apache.org/download.html