网络编程 | 站长之家 | 网页制作 | 图形图象 | 操作系统 | 冲浪宝典 | 软件教学 | 网络办公 | 邮件系统 | 网络安全 | 认证考试 | 系统进程
Firefox | IE | Maxthon | 迅雷 | 电驴 | BitComet | FlashGet | QQ | QQ空间 | Vista | 输入法 | Ghost | Word | Excel | wps | Powerpoint
asp | .net | php | jsp | Sql | c# | Ajax | xml | Dreamweaver | FrontPages | Javascript | css | photoshop | fireworks | Flash | Cad | Discuz!
当前位置 > 网站建设学院 > 网络编程 > Java
Tag:注入,存储过程,分页,安全,优化,xmlhttp,fso,jmail,application,session,防盗链,stream,无组件,组件,md5,乱码,缓存,加密,验证码,算法,cookies,ubb,正则表达式,水印,索引,日志,压缩,base64,url重写,上传,控件,Web.config,JDBC,函数,内存,PDF,迁移,结构,破解,编译,配置,进程,分词,IIS,Apache,Tomcat,phpmyadmin,Gzip,触发器,socket
网络编程:ASP教程,ASP.NET教程,PHP教程,JSP教程,C#教程,数据库,XML教程,Ajax,Java,Perl,Shell,VB教程,Delphi,C/C++教程,软件工程,J2EE/J2ME,移动开发
本月文章推荐
.用单例模式实现的java连接MySql数.
.JBuilder2007——崭新的Java开发.
.为Eclipse plug-in(插件)创建语言.
.JAVA程序的性能优化.
.jdbc 不得不说的几句话.
.简易加法计算器.
.java设计模式之Prototype(原型).
.setUTCMonth 方法.
.用EJB开发在线课堂.
.软件开发成功12法则.
.JBuilder6:Borland方式的Java集成.
.Web 服务代理组件创建 JSF Web 服.
.Weblogic 6.0中Servlet的注册方法.
.Struts的<logic:iterate>标.
.J2ME的体系结构.
.开发webservice应用程序.
.谈模式(Singleton Pattern)的变形.
.通过JCA实现企业级应用程序的“即.
.J2EE基础应用:J2EE中SQL语句自动.
.缺点:丢失的违例.

机器人 小叮咚的 中文分词终于跨出了第一步

发表日期:2008-1-5


 

机器人 小叮咚的中文分词终于跨出了第一步

机器人 小叮咚的帐号:

QQ:
        443803193
MSN:
        xiaodingdong21@hotmail.com

主页: http://xiaodingdong.myshow.cn/index.ASP

网络上有很多算法,借鉴了一下,然后自己用最普通得方法做了一个分词
现在还没有和小叮咚集成,等效果比较满足后,加入小叮咚得问答程序组件


原理是:
对 待解析得句子(长度N)做N次循环

在每次循环中寻找从当前开始位置开始出现的最大词组
(递归实现,先判定第一个,比如“我”,假如存在,把“我们”加起来判定,以此类推....)

找到后返回最大词组,并跳跃到最大词组后得字 重复循环

下面是分词的效果

s = "我们要好好学习天天向上,努力工作,真想睡觉!";
我们要好好学习天天向上

s = "网站计数器都是一种最简单的网络程序应用";
网站计数器都是一种最简单的网络程序应用


s="对我们来说他是一个创造尊严的人一个带来快乐的人一个与许多巴勒斯坦人相比生活异常简单的人他带给巴勒斯坦希望这是难以失去他的真正原因";

对我们来说他是一个创造尊严的人一个带来快乐的人一个与许多巴勒坦人相比生活异常简单的人他带给巴勒坦希望这是难以失去他的真正原因


上一篇:如何写注释 人气:872
下一篇:朝着 零缺陷 的方向 人气:422
浏览全部Java的内容 Dreamweaver插件下载 网页广告代码 祝你圣诞节快乐 2009年新年快乐