说明:双击或选中下面任意单词,将显示该词的音标、读音、翻译等;选中中文或多个词,将显示翻译。
您的位置:首页 -> 词典 -> 中文文本分词
1)  Chinese text segmentation
中文文本分词
1.
Chinese text segmentation is an important question of Chinese information processing, and the settlement will directly influence the development foreground of Chinese information processing.
中文文本分词问题是中文信息处理的一个重要问题,这个问题解决的好坏将直接影响中文信息处理的发展前景。
2)  The Study on Chinese Text Segmentation
中文文本分词研究
3)  Chinese words segmentation
中文分词
1.
For Chinese words segmentation,a module which is based on word library and uses the positive direction maximum matching algorithm was presented.
在该系统模型中,针对中文分词实现了基于词库的采用正向最大匹配算法的中文分词模块;针对多种格式文档的处理采用接口实现的方式和动态实例化的方法,实现了可以有效地处理txt、xml、html、pdf、doc和rtf等常见格式文档。
4)  chinese participle
中文分词
1.
Chinese WEB documents classification involves to the documents automatic capture, the information processing and the extraction, the automatic sorting and so on, this article realizes a open style Chinese WEB documents automatic sorting system, and has applied several improvement algorithms in the system module, in the main solution present information retrieval involves when Chinese participle .
中文WEB文档的分类涉及到文档的自动抓取、信息加工和提取、自动分类等,本文实现一个开放式的中文WEB文档自动分类系统,并在系统模块中应用了几个改进算法,主要解决目前信息检索中涉及中文分词搜索时所遇到的一些问题。
2.
The computer may very easily understand English word, but Chinese sentence which is composed by the word, which can be understood through Chinese participle technology.
计算机可以很容易地理解英文单词,而对由词组成的中文句子,必须通过中文分词技术才得以理解。
3.
It returned to the first results of the Chinese participle and fully tap its semantic information use CC4 neural networks to judge the he rele-vant web page to re-sort the results,and a good solution integrated search engine does not prevail in the search results accurate information stagnant.
它使用神经网络对检索结果进行优化排序,它先对返回结果进行中文分词,在充分挖掘其语义信息的基础上,利用CC4神经网络对网页的相关性进行判断,对返回结果重新排序,很好地解决了综合性搜索引擎中普遍存在搜索结果不准确、信息滞后等问题。
5)  Chinese phrase segmentation
中文分词
1.
To improve the preprocessing performance for anti-spam and to search for phrases more efficiently, this paper creatively constructed an indexing dictionary based on hash algorithm, and designed a method of Chinese phrase segmentation based on this indexing dictionary aiming at anti-Chinese-spam.
通过实验,表明该方法提高了传统机械分词法的效率和准确率,改善了邮件预处理阶段的性能,并且可以广泛地应用于中文分词领域。
6)  chinese word segmentation
中文分词
1.
CRFs-based Chinese word segmentation method with character position probability feature;
基于字位置概率特征的条件随机场中文分词方法
2.
Research of Chinese word segmentation system applies in professional search engine;
一种适用于专业搜索引擎的中文分词系统研究
3.
Chinese Word Segmentation Method Based on Dictionary and Frequency of the Words;
基于词典和词频的中文分词方法
补充资料:AutoCAD中导入超文本实现方法
一、引言
  AutoCAD是应用广泛的CAD软件平台,具有很强的绘图和编辑功能。其绘制的图样能清楚地表达设计者的思想和意图,图样中往往需要加注必要的文字来说明图形所无法表达的信息。除了AutoCAD内含的文本输入命令外,向AutoCAD中输入多行文本即超文本的方法还有:通过Windows提供的剪贴板,利用AutoCAD提供的多行文本命令;利用OLE特性。
  二、用单行文本命令组合实现
  在AutoCAD图样中输入少量文字可以用DText命令实现,如工程图样中的图名、明细表、标题栏、技术要求等的填写。在需要输入多行文本时,可以通过单行文本的组合来实现。即输入一行文本后,再借助复制命令(Copy)和文本编辑(DDEdit或MTEdit)、属性编辑(DDModify)、对象特性工具(Properties)、移动(Move)等命令进行多行文本的输入。但此种方法在换行时的定位及行列对齐都比较困难。且标注结束后,每行文本都是一个单独的实体。所以用其标注多行文本时,其实输入和编辑的功能远远不如下面的几种方法方便。
  三、通过剪贴板来实现
  剪贴板是Windows提供的功能,帮助应用程序间进行数据通讯。虽然利用剪贴板所传递的数据是静态的,即应用程序中对数据的修改不会在目标程序中体现出来,但操作方便、快捷、简单。以Word为例,Word提供了剪切(Cut)、复制(Copy)和粘贴(Paste)三个命令来操作剪贴板。其具体实现方法如下:打开AutoCAD和Word软件,在Word中选中要插入的内容,单击下拉式菜单“编辑”中的“复制”命令。激活AutoCAD,打开下拉式菜单“Edit”中的“Paste”选项,这样Word文档就以AutoCAD绘图区左上角为插入点被插入,此种方法插入的文档位置和字体的大小都会与原AutoCAD图样大小和比例不一致,需进行处理。
  四、用AutoCAD的多行文本命令来导入
  AutoCAD系统提供了多行文本输入命令MText,可以一次标注多行文本,且各行文本都按照指定宽度对齐排列,并成为一个完整统一的实体,其内容可以在多行文本编辑器中直接输入,也可从外部文档导入。
  1.在文本编辑器中直接输入
  在AutoCAD的下拉式菜单“Draw”中选中“Text”,再单击“Multiline Text…”选项,在Command提示区提示用户确定所标注文本的宽度、高度和字体排列方式,系统根据输入信息,确定文本框大小,并弹出一个专门用于文字编辑的文本编辑器,即弹出“Multiline Text Editor”对话框,在选定字型、字高、文本宽度等前提条件后,可直接在“Multiline Text Editor”对话框中进行多行标注文本的输入、编辑、修改等工作。
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条