新京报贝壳财经讯(记者罗亦丹)北京时间10月20日,DeepSeek(深度求索)在开源社区Hugging Face上发布了新模型DeepSeek-OCR。据了解,OCR(Optical Character Recognition,文字识别)模型是一种用来从图像中提取文本的技术。
DeepSeek还上传了与该模型相关的论文,在论文中,DeepSeek-OCR被描述为是“一项关于通过光学二维映射来压缩长上下文可行性的初步研究。”实验表明,当文本标记数量在视觉标记数量的10倍以内时(即压缩比 < 10>
编辑 岳彩周
校对 柳宝庆
发表评论 取消回复