什么是 OCR?
OCR 代表光学字符识别或光学字符读取器。它是一种从图片文件中“识别”或“读取”文本的技术。
OCR 可将文件中键入、手写或打印文本的图片转换为机器可以处理和搜索的文本。这包括文档扫描件、文档照片、带标记的照片、带文字的镜头以及图片上的字幕。
目前,Dropbox 可利用 OCR 来识别 PDF 中的文本,并让您轻松搜索其内容。这可以节省大量时间。
OCR 代表光学字符识别或光学字符读取器。它是一种从图片文件中“识别”或“读取”文本的技术。
OCR 可将文件中键入、手写或打印文本的图片转换为机器可以处理和搜索的文本。这包括文档扫描件、文档照片、带标记的照片、带文字的镜头以及图片上的字幕。
目前,Dropbox 可利用 OCR 来识别 PDF 中的文本,并让您轻松搜索其内容。这可以节省大量时间。
文档扫描仪功能免费,并且面向所有 Dropbox 用户提供。但是,只有 Dropbox Plus、Family、Professional、Standard 或 Advanced 以及 Enterprise 用户可以使用 OCR 功能搜索文档扫描件中的字词或短语。
可以,Dropbox 移动应用的文档扫描仪功能允许您扫描、上传和共享所需的任何文档。
OCR 会使用模式或特征识别以不同方式定义的各个字符,然后“读取”文本,再将其转换为可以搜索的索引文件。
虽然 OCR 和 ICR 听起来很相似,但两者之间还是有很大的区别。OCR 会翻译文本的扫描图像,并将这些扫描结果转换为机器编码的文本。ICR 属于 OCR 的一种,但更特定于文本。ICR 可以学习不同的字体和手写风格,而不仅仅是翻译扫描图像中的文本。
是的,OCR 基于机器学习。OCR 技术复制了人类识别图片、文档等来源中的各种文本模式、字体或样式的能力。
因为机器具有学习能力,所以这项技术才变成可能。OCR 是涉及计算机视觉和机器学习的大型项目的一个典型示例。Dropbox 的工程师一直致力于此。