客户案例 – 合合信息

客户背景

合合信息科技股份有限公司(简称:合合信息)是一家人工智能及大数据科技企业,基于自主研发的领先的智能文字识别及商业大数据核心技术,为全球C端用户和多元行业B端客户提供数字化、智能化的产品及服务。

公司C端业务主要为面向全球个人用户的APP产品,包括扫描全能王(智能扫描及文字识别APP)、名片全能王(智能名片及人脉管理APP)、启信宝(企业商业信息查询APP)3款核心产品;公司B端业务为面向企业客户提供以智能文字识别、商业大数据为核心的服务,形成了包括基础技术服务、标准化服务和场景化解决方案的业务矩阵,满足客户降本增效、风险管理、智能营销等多元需求,助力客户实现数字化与智能化的转型升级。

凭借领先的自主研发技术、成熟的产品落地能力、优质的用户体验及服务质量,公司的C端产品覆盖了全球百余个国家和地区的亿级用户,B端服务覆盖了近30个行业的企业客户。在B端业务方面,公司智能文字识别与商业大数据服务已覆盖了银行、证券、保险、政府、物流、制造、地产、零售等近30个行业的众多头部客户。《财富》杂志2022年发布的世界500强公司名单中,公司客户已覆盖超过125家。

客户挑战

  • 严重依赖预定义模板和大量训练数据集来准确提取信息,需要不断的人工干预来更新模板并提高准确性。
  • 对非标准文档格式、字体样式的变化和复杂的布局的处理错误率高。
  • 在特定场景下对于理解文本的上下文是必要的,但现有模型缺乏这种上下文感知能力。
  • 在数据准备、模型训练、模型调试及部署上耗费大量的精力。
  • 需要一套可以快速扩展的高效的基础架构来支持相关业务。

解决方案

  • 通过apigateway lambda构建了serverless的应用前端,这种serverless的架构设计保证应用的可靠性和弹性,也降低了基础设施的成本。
  • 使用sagemaker进行OCR和模式识别模型的训练和优化。采用sagemaker自动模型调优功能,提供模型的准确性和性能。
  • 将部署好的模型部署到sagemaker endpoint上,提供实时推理服务,sagemaker保障实例的自动扩展,用户可以专注模型的开发和优化。
  • 使用s3存储过程中和最终生成的对象;使用Glue进行数据清洗和转换,确保数据的一致性。
  • CloudWatch和CloudTrail分别用于监控应用程序的性能和记录审计跟踪,以支持故障排查和合规性要求。
  • KMS服务用于加密和解密敏感数据,如文档内容或模型工件,以确保数据安全。

客户收益

  • 大量采用serverless的服务架构大大提高了应用的灵活性,维护成本大幅降低。
  • 使用sagemaker减少了管理基础设施的复杂性,不在需要处理底层配置维护和扩展。
  • 通过训练好的大语言模型对文档处理速度提高了60%,从平均每份文档处理时间缩短了30%。
  • 数据识别的准确率从原理的85%提高到98%。
  • 客户满意度得到提高。