语义分析文字检测识别平台

语义分析文字检测识别平台是基于并行计算系统和分布式爬虫平台,结合独特的语义分析技术, 一站式满足用户NLP、转码、抽取、全网数据抓取等中文语义分析需求的开放平台,用户能够基于平台对外提供的API实现搜索、推荐、舆情、挖掘等语义分析应用,也能够通过与我们深入合作定制产品特色的语义分析解决方案。

语义分析文字检测识别平台流程架构

基于NLP的语义分词

自动化的词库构建

基础数据收集

通过字典

通过词典

....

多维结构分析

拼音、音调

结构、部首

笔画、笔顺

四角编码

五笔编码

....

构建相似字词

基于拼音构建

基于音调构建

基于结构构建

基于部首构建

基于笔画构建

基于笔顺构建

基于四角编码构建

基于五笔编码构建

....

生成错别字词

音似错别字词

形似错别字词

输入法错别字词

多字错别字词

少字错别字词

颠倒错别字词

....

基于群智技术的知识库训练平台

面向大数据的机器学习