「意外と難しい役割認識」でAIが苦手な事例を示しました。さらに「AIを知る」では、「RAG: Retrieval-Augmented Generation: 検索拡張生成」がAIの精度を上げるために必要であるという話を取り上げました。このRAGをする際に、AIには苦手なドキュメントがあります。Wordのようにテキストが主体のドキュメントの内容把握は高いのですが、PDFやExcelの情報認識は精度が落ちます。PDFはOCR(光学文字認識)によってテキスト化しますが、文字が整列していない場合は、文章同士が混在してしまうことが起きます。Excelの表の場合は、セル間の関係性が認識できないことが起きます。特に、プレゼン資料のように図形や矢印で関連付けたり、強調する意図までは読み取ってくれません。私がブログに添付しているPDF形式の資料については、AIはかなり読み取りに苦労しているでしょうね。AIの精度を上げるには、ヒトがAIのRAGの手助けをしてあげることが必要です。AIも育成が大事です。