書籍紹介
本書は、AIを活用して動画の内容そのものから検索を可能にする技術の実装方法を扱います。現在の動画検索がタイトルや説明文といったメタデータに依存し、動画の中身を直接検索できないという課題に対し、本書は映像・音声・テキストのマルチモーダル解析による動画理解の仕組みと、従来の検索方法との違いを明確に提示します。動画からシーン検索を実現するための基礎パイプライン構築では、動画の読み込みとメタデータ取得から始まり、シーン境界の検出、音声認識とOCRによるテキスト抽出、画像キャプション生成、そしてマルチモーダル埋め込みを経て検索インデックスを構築するまでの一連の流れを、実際に動作するコードとともに紹介し、さらに埋め込みベクトルの概念や類似度計算、効率的な検索を実現するベクトルデータベースの活用方法を詳述します。加えて、RAGの基本的な仕組みとその動画検索への応用を通じて、検索と生成を組み合わせることでより精度の高い検索結果を提供できる理由を解説し、デモアプリケーションを使って動画のアップロードからシーン解析、ベクトル登録、自然言語検索までを一気通貫で試せるよう構成されています。 動画解析やマルチモーダルAIに興味がある方には必見の一冊です。
続きを読む
短くする
電子版 ¥1,800 小売希望価格(税別)
印刷版 ¥2,000 小売希望価格(税別)
発行日:2026/06/12
発行社:インプレス NextPublishing
ページ数:94(印刷版)
ISBN:9784295604792
はじめに
第1章 動画検索について
第2章 内容ベース動画検索
第3章 動画シーン検索の基礎パイプライン構築
第4章 検索基盤の構築
第5章 RAGで広がる動画シーン検索
第6章 デモアプリvideo-searchを動かす
第7章 動画検索の精度を向上させるための手法
第8章 実践的なユースケース
第9章 トラブルシューティング
おわりに
伊藤 優汰
インターネット上ではユオレイというハンドルネームで活動しています。ソフトウェアエンジニアとして日々修行中。