1 Star 0 Fork 2

no2key/scws4

forked from xinghuo/scws4 
加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
贡献代码
同步代码
取消
提示: 由于 Git 不支持空文件夾,创建文件夹后会生成空的 .keep 文件
Loading...
README
纯PHP编写的xdb词典(SCWS - http://www.ftphp.com/scws 所采用)导入导出工具!!

1. 词典导出:dump_xdb_file.php 在命令行模式下运行
   php dump_xdb_file.php <要导出的.xdb文件> [存入的文本文件]

   第二参数省略则直接输出到标准输出。

2. 词典生成:make_xdb_file.php 同样是在命令行模式下运行(需要安装 mbstring 扩展)
   默认是处理 gbk 编码的文本,如果你的文本是 utf8,则需要修改该程序的第一行,把
   define('IS_UTF8_TXT',	false);  改为 true

   php make_xdb_file.php <要生成的.xdb> [导入的文本文件]


---
关于文本文件的说明,每行一条记录,#开头表示注释,每条记录由
word、TF、IDF、Attr组成,其中TF是词频系数,IDF是逆词频率系数
而Attr是北大标注法的词性,这四个字段之间用\t隔开。
---

--
hightman.20100304: 修正导出时的一个 bug 导致一堆出错信息..


hightman 特别制作于 2009.7.1
下载地址:http://www.ftphp.com/scws 或 www.hightman.cn/bbs 的 scws 版

空文件

简介

yii 分词插件 展开 收起
取消

发行版

暂无发行版

贡献者

全部

近期动态

加载更多
不能加载更多了
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化
1
https://gitee.com/no2key/scws4.git
[email protected]:no2key/scws4.git
no2key
scws4
scws4
master

搜索帮助