CIEP智力SHOW 84 俄罗斯特辑丨泰比软件公司的人才需求（中俄双语）

项目概况：Mobile Capture SDK为您的客户提供沉浸式的捕获方式，并提供自助式跟踪文档以提高保留率。通过Mobile Capture为您的应用程序提供动力，通过简单的两步流程为您的客户轻松实现移动文档捕获，从而提供卓越的客户体验;点和捕获。ABBYY Mobile Capture是一款SDK，可在您的移动应用程序中提供自动数据捕获，提供实时识别和捕获文档照片，以进行设备上或后端处理。

使用案例

跨行业的登录移动捕获：实现客户服务流程以捕获身份证明文件、财务确认、运输详细信息、医疗保健信息和其他形式对于支持以客户为中心的自助服务登录体验至关重要。

客户注册：通过简单地将移动设备的相机指向身份证、护照和其他身份证明文件，客户数据就可以通过最少的人力输入到公司系统中。登录银行、保险公司和其他组织的新客户以及在酒店或汽车租赁公司注册新客户的流程可以更快、更高效。由于没有存储文档照片，因此可以保证数据隐私。

移动客户自助服务：企业公司可以通过提供便于客户轻松交流并交换数据以完成交易的应用程序来提高客户满意度和忠诚度。通过以最少的人工交互进行数据传输的应用程序，例如提供收入证明、身份验证、公用事业账单、保险单等等可以显着降低客户服务交易的成本。

创造有价值的用户体验：通过将直观的移动应用程序与功能强大且支持Al的后端解决方案相连接，您可以增加用户利益并创建个性化且有价值的用户体验。ABBYY Mobile Capture是直观移动输入解决方案的理想技术，需要能够捕获图像或支持各种数据捕获方案。

移动输入：可捕获图像或支持各种数据捕获方案的准确而直观的移动输入解决方案对于提供卓越的客户登录和自助服务方案至关重要。用户可以拍摄所需文档的图像，然后将其发送到后端服务器以进行识别、验证和进一步处理。

端到端解决方案：结合我们的云或内部后端技术，如ABBYY FlexiCapture，FlexiCapture Engine和ABBYY Cloud OCR SDK，它可以帮助企业有效地使用移动设备作为客户入职和自助服务方案的可靠文档和数据输入方式。

ABBYY Mobile Capture的特点

指向和捕获：自动捕获适合进一步后端处理的最佳质量图像。

自动文档检测：自动检测边界，裁剪文档并更正其透视图。

设备上的OCR：当用户只是将相机指向文档或对象时，可以从静态图像或从相机预览屏幕自动识别文本。

可定制的数据捕获：通过设置描述所需内容的正则表达式，从文档中提取任何特定数据。通过简单地应用预定义的配置文件来捕获机器可读区域（MRZ）或国际银行帐号（IBAN）。

即装即用的ID读取和文档捕获：轻松添加从特定文档、护照、身份证、驾驶执照、银行卡等中提取重要字段的现成功能。

即用型名片阅读：只需将相机指向卡上，即可在移动CRMZIead管理应用程序中使用或用于客户登录，即可自动从名片中提取联系人数据。

图像导出：提供灵活性，可在不同的图像导出格式（PDF、JPEG、JPEG2000、PNG）和压缩级别之间进行选择，以进行进一步的后端处理。

多语言OCR：提供63种语言的文本识别，以支持您在全球上使用您的应用。

跨平台集成：Cordova Plugin将文本捕获、数据捕获和其他功能集成到基于Apache Cordova Framework的跨平台应用程序中。

从对象捕获文本：轻松捕获街道标志或车牌等物体上的文字。

所需资源描述

拟合作方式：完全转让，技术授权，服务，咨询

ABBYY Mobile Capture SDK

Mobile Capture – универсальный инструмент для разработчика, который позволяет встраивать в мобильные приложения и клиенты функции автоматического захвата изображений документов и распознавания текста. Преимущества：- Повышайте конкурентоспобность бизнеса -Увеличьте эффективность ваших приложений -Сократите время на разработку приложений Ключевые возможности：-Автоматический захват наилучшего снимка документа -Детектирование границ документа -Профили распознавания для документов, удостоверяющих личность -Распознавание визиток -Разные форматы экспорта -Поддержка 63 языков распознавания -Кросс-платформенная интеграция -Распознавание текста с поверхностей различных предметов.

·02·

ABBYY FineReader Engine 12

项目信息

项目概况：ABBYY FineReader Engine软件开发工具包允许软件开发人员创建可从纸质文档、图像或显示中提取文本信息的应用程序。这种人工智能驱动的OCR SDK为您的应用程序提供出色的文本识别、PDF转换和数据捕获功能，使其能够将扫描件转换为可搜索的PDF、Word或Excel文档以及访问照片或屏幕截图上的数据。

主要特点

ABBYY FineReader Engine软件开发工具包为创建为Windows、Linux和Mac OS平台应用程序的开发人员提供了高级功能。

为多语言识别的全面识别技术集。OCR技术可用于200多种语言，包括欧洲和非欧洲语言（CJK，阿拉伯语等）。

功能强大的PDF处理工具。

该SDK提供文件转换为可搜索的PDF和PDF / A格式。导入PDF文件时，可以在保留PDF属性时注入缺失的文本图层。XML数据可从导入的PDF / A-3文件中提取，也可以在保存为PDF / A-3格式时插入。

人工智能和机器学习

结合ABBYY的ADRT（Adaptive Document Recognition Technology）和其他技术的基于AI和ML的强大技术以重新创建原始文档检测文档的逻辑结构并识别内容表、页眉、页脚、字体和字体样式等格式化元素。

支持云和虚拟环境

除了内部部署之外，软件开发人员还可以选择在虚拟环境中部署应用程序，或将其产品托管在阿里云（Aliyun）或Microsoft Azure等云平台上。

高级图像预处理功能

图像预处理通过优化用于OCR的图像来提高识别准确性。即使低质量的图像也可在去偏、旋转、失真校正、文本行校直、页面分割、自适应二值化、ISO降噪等图像校正步骤之后提供最佳的OCR结果。

示例代码库

详细的SDK文档和支持

详细的文档有助于简化集成。开发人员可以通过ABBYY知识库和Technology Portal访问其他资料。除了这些资料之外，您可以使用免费使用版时请求ABBYY技术支持帮助。

使用机器学习和NLP进行文档分类

FineReader Engine的高级分类算法利用机器学习、OCR和自然语言处理技术并使应用程序能够自动将文档分类到不同的类。

OCR阶段

ABBYY FineReader Engine OCR过程由多个步骤组成，从导入图像到导出识别结果。

图像导入

OCR开发人员工具包可以接收来自多个来源的图像。可以导入保存为TIFF、JPEG、PDF或其他图像格式的文本图像，同时可以直接从存储器处理拍摄的文本或扫描的纸张文档。

图像预处理

为了提高识别准确度，在预处理步骤期间图像质量得到增强。该SDK以优化图像质量应用了广泛的成像功能，如图像旋转、二值化、去偏斜等等。

文本导入和文件重建分析

使用基于AI的算法和ABBYY Adaptive Document Recognition Technology （ADRT®），OCR工具包可以分析每个单独页面的布局以及整个文档的结构。在文档分析步骤中，文件根据其逻辑结构被进行分析 SDK为导出- 识别结果第一个和最后一个文档页面，检测脚注、页眉、页脚和内容表格等格式元素。同时，检测每个单独页面的布局重建，并将每个页面分成单独的不同级别提供了多种选择。有多种存储格式可用：对象，如文本块、XML图片、不同类型的PDF表格和PDF / A表格单元格式、可编辑条形码和分隔符。此外，文档分析算法检测页面方向，识别双页，检测垂直文本。该过程定义了文本识别的Microsoft®区域，并在OfficeCR过程结束时为最终文档重建提供有关布局和其他保存格式化元素的信息。

识别

具有最高的精度，ABBYY FineReader Engine SDK可提取多种语言的机器打印和手写打印文本（OCR、ICR）以及各种其他信息，包括检查标记（OMR）和条形码（OBR）。通过创建自己的字典或识别模式，开发人员可以提高特定语言、不寻常字符或字体的识别准确性。

文本导入和文件重建

OCR SDK为导出识别结果和文档布局重建的不同级别提供了多种选择。有多种存储格式可用：文本、XML、不同类型的PDF和PDF / A格式、可编辑的Microsoft®Office文档和其他保存格式。

所需资源描述

拟合作方式：完全转让，技术授权，服务，咨询

ABBYY FineReader Engine

ABBYY FineReader Engine – многофункциональный инструментарий разработчика, который позволяет встраивать в приложения интеллектуальные технологии распознавания данных. С помощью OCR на основе технологий искусственного интеллекта вы можете создавать приложения с функциями качественного распознавания информации из документов, изображений, фотографий, скриншотов, мониторов и дисплеев, определения типа документа, конвертации сканированных документов в файлы форматов Word, Excel и PDF с возможностью поиска.

Возможности：

• Разработка приложений для Windows, Linux, и Mac OS.

• Искусственный интеллект и машинное обучение

• Многоядерные процессоры и параллельная обработка

• Поддержка облачных технологий и виртуальной среды

• Передовые возможности предобработки изображений

• Готовое решение для распознавания визитных карточек

• Классификация документов с помощью технологий машинного обучения и обработки естественного языка

• Компоненты пользовательского интерфейса

• Библиотека примеров кода

• Подробная документация и поддержка

·03·

ABBYY FineReader Server

项目信息

项目概况：ABBYY FineReader Server是专为高容量文档转换而设计的，可自动将大量文档转换为可以搜索、可以分享的数字化图书馆。我们基于服务器的OCR和PDF转换工具可以快速、准确、自动化地将扫描或电子文档转换为PDF、PDF / A、Microsoft Word或其他格式，以便于长期保存、协同工作或者其他处理使用.

产品特性

可靠的字符识别：提供快速、准确的识别结果，支持超过 190 种语言。

高负荷调节：短时间内即可完成大批量文档转换。

基于服务器的构架：尽可能以最高效的方式利用所有可用的硬件资源。

灵活的PDF技术：最大程度压缩PDF文档体积，同时保持文档质量；可支持多种PDF格式，包括：PDF/A-1a、PDF/A-1b、PDF/A-2u以及PDF/A-3a。

支持多种文件格式：能自动完成多种文件格式的转换，包括：PDF、JPEG、TIFF、Word、Excel、OpenDocument Text、PowerPoint、HTML 等。

提供SharePoint集成：自动将 SharePoint 文件库中的文件转换为可搜索的 PDF 文档。

条形码和二维码识别：读取条形码和二维码，并将读取的信息用于文档分割和（或）添加元数据。

文档类型和元数据：自动指定文档类型和属性；并可根据需求手动创建元数据。

历史字体识别：支持识别英语、德语、法语、意大利语及西班牙语中的大部分哥特体字符，如 black letter 和 Schwabacher 等字体。

与现有系统的集成：通过 XML 票证、基于 COM 的 API 以及基于网络服务的 API ，与已有的数字存档或企业内容管理系统连接。

文档分割：可按照页码、空白页、条码页及（或）用户脚本等方式，自动分割文档。

用例

长期文件存储:通过将大量文档转换为易于访问的数字档案，便于人们遵守政府和公司的法规。

用于数字取证、防范数据丢失、eDiscovery的数字内容: 自定义FineReader Server来提供数字化文档，可以用于数字取证、防范数据丢失、eDiscovery和其他用途。

替换物理文档存储: 回收以前由文件柜和堆放箱子占用的办公空间。

完全可搜索的SharePoint库: FineReader Server与SharePoint无缝集成，可以连续抓取库并自动转换新添加的文件，并在需要时将原件保留在原位。

数字档案: 将历史文档转换为可搜索，易于阅读的PDF、XML或EPUB文件。通过将历史字体中印刷的手稿数字化并将其保存在数字图书馆中以供后代保存，从而保护文化遗产。

所需资源描述

拟合作方式：完全转让，技术授权，服务，咨询

ABBYY FineReader Server

ABBYY FineReader Server – корпоративное серверное решение для распознавания, хранения и преобразования файлов в PDF и другие электронные редактируемые форматы. Решение быстро и точно распознает текстовые изображения и переводит их в PDF, PDF/A, Microsoft Word или другие типы файлов, удобные для поиска, просмотра, обмена и хранения. Выгоды: *Оптимизация документооборота *Быстрый старт проекта *Оптимизация работы сотрудников *Простота использования *Обеспечивает хранение документов в едином формате *Быстрый поиск документов.

·04·

ABBYY FLexiCapture 12 SDK

项目信息

项目概况：FlexiCapture SDK使软件开发人员能够快速创建从文档中提取含义的应用程序。FlexiCapture SDK非常适合希望将强大的数据捕获功能集成到其解决方案中的系统集成商，RPA供应商和服务提供商。通过使用ABBYY的机器学习和AI，最终客户能够更快地处理更多交易，并减少错误，从而改善客户服务，降低成本并制定更明智的流程决策。作为FlexiCapture平台的交付选件，FlexiCapture SDK为开发人员提供了强大而灵活的工具包，以平滑地集成ABBYY的行业领先的数据捕获技术，从而根据垂直市场的需求为其产品和服务提供支持。

为什么选择ABBYY FlexiCapture SDK?

高质量的数据输出:FlexiCapture SDK采用屡获殊荣的 OCR 技术，并提供内置的验证规则，确保出色的数据准确性。

与应用程序紧密集成: FlexiCapture SDK使开发人员能够将数据捕获无缝集成到其应用程序中，并保持对文档处理，提取的数据和文档路由的完全控制。

简化的自动文档处理: 为了实现高效率，FlexiCapture SDK提供了一套完整的技术和工具，可简化结构化和非结构化表单和文档的处理，包括数据校验，高级文档分类，通过反馈学习以及导出以进行后端处理和归档。

在熟悉的环境中编程:SDK API符合COM标准，可轻松用于C / C ++、Visual Basic、Java或任何其他支持COM组件的开发工具。

产品特点

灵活的导出选项: 减少文档存储所需空间！使用我们新增的导出选项，你现在可以管理输出文件的大小与质量，从而最大限度提高数据存储效率。对导出的改进包括：导出时可以选择 PDF/A 格式，导出带标记的 PDF，PDF 的快速 web 视图选项，导出为 UTF 时不写入 BOM（字节顺序标记）字符。

更好、更快的 OCR: ABBYY FlexiCapture SDK采用最新一代的 ABBYY OCR 技术。借助引擎背后的新一代核心技术，你可以更快、更高质量地处理阿拉伯语、中文、日文及韩语文本。

云部署: 云环境越来越受欢迎，越来越多的客户将他们的服务托管在云上。新的 FlexiCapture SDK可以运行在这些虚拟环境、容器及虚拟机上。

图像增强及图像质量控制: 现在你可以手动或自动改善移动设备拍摄的图像。借由这个特性，你可以处理带有复杂背景的文档，比如身份证、保险单等等。

兼容FineReader Engine的API: 融合 ABBYY 强大的解决方案，你可以完成具有挑战性的项目！

支持32位和64位: FlexiCapture SDK同时支持 32 位和 64 位架构的操作系统。

支持不同类型文档的数据采集: 不管是固定格式的表单还是半结构化格式的文档，ABBYY FlexiCapture SDK都可以从中提取数据。它能够快速定位所有必需的数据字段，并以合适的格式提取出来。

文档分离自动化: FlexiCapture SDK可用于分隔文档、识别文档类型。

高性能与快速响应：通过创建并行运行在不同进程上的处理器池，我们可以改进服务器应用程序的性能和响应能力。客户端请求由不同的 CPU 核心独立处理，无须在队列中等待，服务器应用程序因此响应更快。另外，单一长任务拆分成多个小任务并行处理，能够合理利用多核 CPU 的运行能力，从而提高性能。

可快速创建文档定义的可视化工具：借由 FlexiCapture SDK提供的可视化开发工具，无需编写一行代码，你就能给特定文档类型开发、测试、维护各种高精度的数据采集方案。

世界上最广泛的语言支持：FlexiCapture SDK支持 207 种 OCR 及 112 种 ICR 语言，它简化了应用程序的本地化开发，使得开发人员能够轻松满足全球客户的需求。

通过训练来创建文档定义：开发人员使用 FlexiCapture SDK创建的解决方案，能够自动学习新文档类型并识别数据提取相关字段。

丰富的代码示例库：一套全面的代码示例，教你如何使用 SDK 编程。每个库都包含代码片段及操作说明，一步步教你如何完成相应任务。

结合相机 OCR 技术实现移动数据采集：FlexiCapture SDK给企业及 ISV（独立软件供应商）提供了一个平台，让他们可以快速开发具有移动前端的数据采集应用程序。

所需资源描述

拟合作方式：完全转让，技术授权，服务，咨询

ABBYY FlexiCapture SDK

ABBYY FlexiCapture SDK – инструментарий разработчика, который позволяет встраивать технологии интеллектуальной обработки информации в Windows-приложения.

С помощью SDK компании могут быстрее проводить транзакции, сократить количество ошибок в обработанных данных, улучшить клиентское обслуживание, уменьшить расходы и ускорить процесс принятия решений. Возможности: - Высокая точность извлеченных данных -Улучшение и оценка качества изображения -Обработка любых документов -Интеллектуальная классификация - Автообучение -Настройка с использованием API -Пакет разработчика -Гибкие параметры экспорта -Извлечение данных из любых типов документов.

·05·

ABBYY FLexiCapture 12

项目信息

项目概况：ABBYY FlexiCapture 是一个高精度且可定制的数据处理和文档提取解决方案，可智能地从图像文件、电子邮件和文档流中抽取重要数据，对其进行分类处理，并最终呈现给决策者 - 为用户提供更好的性能、透明化的文档处理流程及可预测的工作量。

FlexiCapture的特性

智能捕获：智能捕获能够自动对信息进行组织处理，将用户通信和操作流程的关键业务数据 (诸如用户请求，查询和交易信息等) 进行分类，提取和验证。

自动学习：全新的自动学习技术允许用户训练系统来处理灵活的或者不规则排版的文档，同时用户对文档的编辑，微调甚至放弃自动学习的处理结果都有完全的控制权。支持和维护系统的成本将大幅度降低。

高级文档分类：高级文档分类可以检测每个导入的文件类型，采用逻辑形式给您带来更快的响应与及时的决策体验。

在深度和广度方面都可以：FlexiCapture 在部署过程中对于文档识别在深度和广度方面都具有很好的扩展性，以支持大容量和快速的文档处理场景。您可以通过集中配置和管理来控制多服务器安装、分布式基础设施和运营商。

服务级别协议服务：使用新的服务级别协议监控功能对服务级别协议进行监控和分析：设置文档处理的优先级并更改队列中文档的顺序以加快处理所需的时间。

多租户：为用户创建安全隔离的环境，并通过「多租户功能」对不同用户采用同样的政策。

案例管理：通过新的案例管理功能，为特定流程，交易或用户案例 (如抵押，保险和财务应用) 预设文档。通过预定义的案例规则为获得文件的完整性和合规性会自动检查多个保险和抵押案例。

文档分析功能：即使数字文稿中的文本已经失去了可读性，通过使用复杂的文档分析功能，FlexiCapture 也能够精确地检测出纸张或者数字文档 (电子表格，图像，徽标等) 的类型以及文稿中不同区域的文字。World、Excel、PDF、电子邮件正文、扫描图像和其它数字文档皆可在同一流程中处理。

多级别数据保护：数据在具有不同访问权限的运营商间交换和验证时，可以使用不同的多级别数据保护功能来隐藏文档内的各种机密数据。HTTPS 能够在用户和服务器之间提供双向加密，防止数据拦截和篡改攻击。

高级监控和分析工具：高级监控和分析工具可帮助您分析文档处理流程，确保业务流程的连续性，优化资源或软件包的优先级，以调节性能并消除瓶颈。

顺畅的整合过程：FlexiCapture 强大的 API 和先进的脚本可以与任何记录和参与系统 (包括 SAP，Oracle，Microsoft，Laserfiche 等) 紧密集成。

移动捕捉：使用移动设备处理文档资源以提高输入数据的可用性和处理速度。通过图像增强工具保持通过移动设备上传文档的质量。当图像上传并被正确处理时，您会收到确认通知。

灵活定制：FlexiCapture 的 Web API 和定制脚本可以开发定制解决方案，支持特定的业务场景，并能够保证轻松集成到企业工作流程中。了解更多 – 参考系统定制页面。

项目前景：

所需资源描述

拟合作方式：完全转让，技术授权，服务，咨询

ABBYY FlexiCapture

ABBYY FlexiCapture – универсальная платформа для интеллектуальной обработки информации из любых типов документов: отсканированных бумаг, фотографий, электронных документов, текстов писем и вложений. Решение распознает, классифицирует документы, извлекает данные, проверяет их корректность и передает в корпоративные информационные системы. Применение ABBYY FlexiCapture существенно оптимизирует все бизнес-процессы, связанные с документооборотом. Возможности：-Интеллектуальное извлечение данных -Автообучение -Масштабируемость и высокая производительность -Единое решение для всех типов документов -Улучшение изображений -Обработка текста на естественном языке

(Natural language processing, NLP) -Мобильный ввод данных -Интеллектуальная классификация.

机构信息

项目机构：泰比软件公司 ABBYY

机构简介：ABBYY 致力于人工智能（AI）和语言软件开发，提供全套文档识别、转换和数据捕捉技术的产品解决方案。

ABBYY集团的工作人员有65%是科学家、开发者和工程师。ABBYY人员的平均年龄是30.3岁。大多数产品开发于总部（HQ）莫斯科，ABBYY软件服务站（莫斯科）决策公司的技术战略，开发软件产品，并控制公司的总体管理。

ABBYY在美国、乌克兰、中国、日本和欧洲设有代表机构，负责在俄罗斯和世界其他地区的销售工作。ABBYY在全球超过80个国家设有分布式的伙伴网络，包括法国、英国、澳大利亚、意大利、印度等。

◆项目来源◆

俄罗斯联邦科学与高等教育部

如有意向共同合作实施，

可联系我们，

我们将准备提供更详细的资料。

联系人:段晓宇15804505626

邮箱:duanxiaoyu0158@163.com

[手机扫一扫]

网站管理：科学技术部国外人才研究中心

ICP备案序号：京ICP备17022585

地址：北京市海淀区北蜂窝中路3号

电话：010-58882404