语义挖掘
Kamala
Utenet-Kamala 语义挖掘平台是渊亭科技自主研发的新一代文本处理和语义挖掘工具集。平台基于成熟的自然语言处理算法、深度学习算法等打造,充分融合渊亭科技多年来在该领域的研究和积累。平台从对语料的资源管理、标注出发,结合自然语言处理、深度学习等类型的模型、算法,挖掘出文本、图像和视频等内容中有价值的语义信息,为客户供全栈的语义挖掘能力支持,进而支持复杂上层业务的开展。
核心技术
CORE TECHNOLOGY
成熟的语义挖掘能力持续升级工具
具有主动学习能力的数据标注工具
丰富的内置自然语言处理预训练模型
丰富的内置深度学习算法模型
语义模型一键发布
灵活的基础能力集成框架
产品优势
ADVANTAGE
全栈式语义处理
提供一整套实现行业文本处理和语义挖掘的方法论和工具集,涵盖可视化数据标注、算法选择、模型训练全部环节
深度学习与语言学深度结合
基于最新深度学习技术和神经网络,提取海量文本数据的潜在语义特征,同时结合语言学进行句法语义、篇章文档等分析
全面整合前沿优秀技术方案和数据集
产品全面整合了各个应用场景下的优秀技术方案和数据集,包括BERT、PCNN+ATT、ULMFiT 等
小样本数据下的模型能力
运用自学习技术,在少量标注样本的情况下,仍然能够进行模型训练和应用
功能完备的自学习引擎
内置反馈系统收集使用信息,并自动转存标注数据并进行模型重新训练,达到“使用越久,精度越高”的自学习效果
客户案例
CASES
某银行自然语言处理与智能问答系统
  • 客户名称
    某四大行之一
  • 所属行业
    金融
  • 客户痛点
    客服问答只能解决高频结构化问题(依赖人工标注关键词QA对),对于开放性非结构化问题处理困难,问答准确率难以提升。
  • 应用成效
    应用语义挖掘、知识图谱等技术,为客户提供一个集日常问答、知识点抽取、知识图谱生成、语义挖掘、语音分析等功能为一体的智能问答机器人系统。精确定位用户所需要的实际知识,并围绕其进行扩展,提供个性化的信息服务。
  • 推荐产品