SCWS 1.0.3 开源免费的简易中文分词系统,PHP分词的上乘之选!

首页   下载   演示   文档   关于   服务支持   论坛   FTPHP  

下载:SCWS-1.1.1 - scws 完整源代码套件

  SCWS 全部源代码,包括 libscws 核心库,命令行工具程序,php 扩展代码,规则集及文档。
  使用 ANSI-C 语言开发,推荐在 Unix-Like OS 的 gcc 环境编译安装(也支持 cygwin 环境)。

   [立即下载: scws-1.1.1.tar.bz2 (272KB)]  [详细安装说明]  [C-API 文档]  [PHP扩展-API 文档]

  php_scws.dll 是由 ben 移植用于 Windows 平台下的 PHP 动态扩展库,请根据您使用的 php 版本下载,编译环境均为:VC6 x86 Thread Safe。

  [For PHP-4.4.x (20KB)]  [For PHP-5.2.x (20KB)]  [For PHP-5.3.x (20KB)]  [详细安装说明]  [PHP扩展-API 文档]

  XDB 格式的词典文件,可用于 SCWS-1.x.x 和 PSCWS4,不可用于 PSCWS23。
  此为通用词典文件,定制词典或其它服务请查看服务支持页面。

  [简体中文(GBK) (3.84MB, 28万词)]  [简体中文(UTF-8) (3.9MB, 28万词)]  [繁体中文(UTF-8) (1.21MB, 10万词)]

  这是用纯 PHP 代码实现的 C 版 Libscws 的全部功能,即第四版的 PSCWS,速度较慢,不推荐使用。
  下载包不含词典,请从上面 XDB 词典中下载。

  [立即下载: pscws4-20081221.tar.bz2 (18.1KB)] [说明文档]

  纯 PHP 开发的 SCWS 第二版和第三版,仅支持 GBK 字符集,速度较快,推荐在全 PHP 环境中使用,已含专用 xdb 词典一部。

  [立即下载: pscws23-20081221.tar.bz2 (2.79MB)] [说明文档]

  SCWS 及 PSCWS4 通用的规则集文件,用于识别人名、地名、数字年代等。内含简体GBK、繁体UTF8、简体UTF8三个文件。
  一般不需要单独下载,随 scws 一起发布的源码包中已经包含这些文件。

  [立即下载: scws-rules-all.zip (6.67KB)]

  XDB文件是专为 SCWS 优化而开发的一个高效简易存储结构,不能直接编辑和查看。现特意用纯 PHP 脚本编写了2个小工具,可以直接将 xdb 文件导出成可视的纯文本文件,以及由这样的文本文件导入生成 xdb 文件。

  [立即下载: phptool_for_scws_xdb.zip (9KB)]




(C)opyright 2007, 2008, 2009, Powered by FTPHP | 浙ICP备08002718号