标签 gemini 下的文章 - 蜗牛工作室_刘永个人博客

woniu 

2025-06-04 00:01 来自蜗牛工作室_刘永个人博客

SOTA 大模型遇上加密数据评测：Qwen3 未破 10%，o1 也栽了

大语言模型面对加密数据，即便最新的qwen3也会感到压力！尽管当下各类推理模型在多种基准测试中表现优异，但在密码学这样对逻辑严谨性和细节准确性要求极高的专业领域，模型的推理能力还有待深入挖掘。密码学不仅... SOTA 大模型遇上加密数据评测：Qwen3 未破 10%，o1 也栽了

SOTA 大模型遇上加密数据评测：Qwen3 未破 10%，o1 也栽了

woniu 

2025-06-03 23:55 来自蜗牛工作室_刘永个人博客

全面评估多模态模型视频 OCR 能力，Gemini 准确率仅 73.7%

多模态大模型（mllm）在静态图像上已展现出强大的光学字符识别（ocr）能力，可以精准识别和理解图像中的文字内容。不过，当应用范围扩展到动态视频时，即使是当下最先进的模型也遇到了巨大的难题。 MME-Vi... 全面评估多模态模型视频 OCR 能力，Gemini 准确率仅 73.7%

全面评估多模态模型视频 OCR 能力，Gemini 准确率仅 73.7%