01.文本分类
针对不同长度的文本进行分类,支持用户自定义类别,既支持层次结构(比如树状)的分类体系,也支持扁平结构的分类,可以满足不同垂直领域的用户的实际需求。
02.文本预处理
提供分词、词性、实体识别等多种自然语言处理基础技术,并支持用户自定义词典,满足不同领域、不同场景的用户需求。
03.词频统计
用户可以输入关键词获得自定义文本中的关键词出现次数。
04.共现词统计
通过词汇在文件或者语料库里共同出现的次数统计,用户可以输入词组获得自定义文本中的词组共同出现的次数,可以为人工确定词间关系起到指引和减轻工作量的作用。
05.可读性
用户可以选择自定义的文本或文本集合,系统自动统计一些较常用的可读性指标,并提供统计结果的 Excel 文档。
06.文本相似度
依托海量数据和语音语义融合技术,从语义层面计算不同文本之间的相似度,并输出一个介于0到1之间的分数,分数越大则文本之间的相似度越高。
07.情感分析
基于深度学习技术,提供潜在的情绪情感智能分析技术,帮助识别客户的真实感受,提供更加人性化的服务。
08.前瞻性
主要通过分析文本中出现的相关前瞻性句子的频率,计算文本的前瞻性程度。