1) automatic text analyses
![点击朗读](/dictall/images/read.gif)
文本自动分析
3) automatic text categorization
![点击朗读](/dictall/images/read.gif)
文本自动分类
1.
Study of automatic text categorization based on CBR;
![点击朗读](/dictall/images/read.gif)
基于CBR的文本自动分类研究
2.
Research on Automatic Text Categorization System Based on Neuron Network;
![点击朗读](/dictall/images/read.gif)
基于神经网络的文本自动分类系统的研究
3.
So builds up an automatic text categorization based on agent.
![点击朗读](/dictall/images/read.gif)
文中构建一种基于Agent技术的文本自动分类系统,仅需要对文档头进行信息处理就可以进行快速文本分类,有效地减少了文本分类过程中的时间和空间的消耗。
4) automated text categorization
![点击朗读](/dictall/images/read.gif)
文本自动分类
1.
Research on Automated Text Categorization Based on RBF Network;
![点击朗读](/dictall/images/read.gif)
基于RBF网络的文本自动分类的研究
5) Text Categorization
![点击朗读](/dictall/images/read.gif)
文本自动分类
1.
Application of SVM to text categorization;
![点击朗读](/dictall/images/read.gif)
SVM在文本自动分类中的应用
2.
Model of Domain Natural Language Text Categorization and Its Application on Requirement Analysis of Mechanical;
面向领域自然语言的文本自动分类及其在产品设计中的应用
3.
Automatic text categorization(ATC) is the most popular text processing techniques and one of the hot issues in the fields of machine learning,natural language processing and information retrieval.
文本自动分类是目前最常用的文本信息自动处理技术,也是机器学习、自然语言处理和信息检索领域的研究热点之一。
6) Text automatic classification
![点击朗读](/dictall/images/read.gif)
文本自动分类
1.
Text Automatic Classification is an important application field of natural language process, an efficient means and necessary trend to substitute the troubled traditional manual classification.
文本自动分类技术是自然语言处理的一个重要的应用领域,是替代传统的繁杂人工分类方法的有效手段和必然趋势。
补充资料:印刷文本版面分析
印刷文本版面分析
printed page analysis
y inshua wenben banm一an fenxi印刷文本版面分析(printed page analysis)对印刷文本版面的排版格式进行自动分析、切分和标识的过程。实际的印刷文本可分为若干不同属性的文本块,例如标题、作者、正文、图象、图形、表格、公式、注释、页码等,正文块可由单栏、双栏、三栏等编排而成。文本块之间用空白条、直线、装饰线、花边等隔开。对于较复杂版面,要在版面理解的基础上才能正确分析和切分。版面分析和理解的任务是利用文本块本身的信息和它们编排成版面的规则等先验知识对印刷文本的文本块进行切分并对其属性和各文本块之间的连接等逻辑关系进行分析和判定,确定是否同一篇文章的文本块和它们之间的连接顺序关系。例如,通过版面分析,按标题、作者、摘要、正文(可能由不同栏目的正文块连接而成,其中包括表格)等顺序,剔除图象、图形、花边等不能识别的文本块,连接成一个完整的文字文本块的图象文件送到识别预处理(参见汉字识别前处理)环节,才能进行识别。 版面分析的基本方法是利用文本图象的水平、垂直投影确定出各文本块的边界进行切分。有自底向上和自顶向下两种分析方法。版面理解是根据各文本块内图象投影值的特征和该块在版面中的位置特点来进行的。例如,正文的某一方向投影有周期性空白行的特征,而插图的投影则无此种周期性;图象块的黑象素比图形一般要多;标题的空白间隔比正文行间隔要大,且位置一般在正文之前(横排版)等等。对各文本块的属性作出判别后,剔除图象、图形等不能识别的文本块,找出该版面中的各标题,按标题从左到右,从上到下顺序联接各文本块,就完成了该版面的分析和理解。由于实际文本版面多样、复杂,所以,在一个实用识别系统中,版面分析和理解常做成交互形式,必要时可辅以人工修改。
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条