ECのサイト内検索で、次のような悩みは起きがちです。
- 商品はあるのに検索でヒットしない
- 検索結果が0件になる(検索0件率が高い)
- 表記ゆれ(英語/カタカナ/略称/全半角)で取りこぼす
- 商品数が増えて、タグやキーワード整備が追いつかない
サイト内検索は、広告費を増やさずに体験と売上を底上げしやすい領域です。一方で、検索の改善が進まない理由は「検索エンジンの性能」よりも、商品データ側の“語彙不足であることが多いです。
本記事では、商品情報からAIで検索キーワードを自動生成し、運用に組み込める形にした取り組みを、EC運用の視点でまとめます。

サイト内検索が弱い原因は「語彙の不足」になりやすい
ユーザーは、商品名どおりに検索してくれるとは限りません。むしろ多いのは、
- 言い換え(例:専門語→一般語、用途語)
- 表記ゆれ(例:英語→カタカナ、全角→半角)
- 省略や通称(例:略称、型番の一部)
- 目的ベース(例:ギフト、時短、持ち運び)
といった “ズレ” です。
このズレを吸収する定番の方法が、商品ごとに検索用のキーワード(別名・関連語・用途語)を持たせることです。
しかし、商品数が多いほど人手での整備は継続が難しくなります。

そこで「商品キーワード整備」を自動化した
今回の仕組みはシンプルです。
- 商品のタイトル・説明・カテゴリ・タグ・バリエーションなどを集める
- AIに「検索されそうなキーワードを重複なしで100語出す」ように指示する
- 生成結果を商品データとして保存する
- 管理画面で単体生成・一括生成ができるようにする
狙いは、キーワード作成を完全自動にすることではなく、“ゼロイチ”を自動化して人の作業を最終調整に寄せることです。
- AI:候補を幅広く出す(表記ゆれ・類義語も含める)
- 運用者:NG表現の除外、優先語の追加、粒度の統一
この分担にすると、運用として回りやすくなります。

運用に載せるための設計ポイント
1. 出力形式は「後工程が楽」な形に固定する
AIの出力は放っておくと自由文になりがちです。運用で扱うなら、最初から形式を固定します。
- 例:カンマ区切り(CSV的)、100語、重複なし
こうしておくと、保存前後で次の処理がやりやすくなります。
- カンマで分割 → trim → 空要素除外 → 重複排除
- 全半角・大小文字の正規化
- 禁止語・NGワードのフィルタ
最初から完璧を狙うより、整形を段階的に強くできる前提にしておくのが運用向きです。
2. 「単体」と「一括」で実行方法を分ける
運用では、生成したいタイミングが2種類あります。
- 新商品登録直後:その場で単体生成して反映したい
- 既存商品の棚卸し:対象をまとめて一括生成したい
一括は商品点数が増えるほど時間がかかるため、非同期(キュー)にして管理画面の待ち時間を増やさないようにします。
この分け方は、運用ストレスを大きく下げます。
3. 生成済みステータスを見える化する
「どれが生成済みか」が分かるだけで、運用が回りやすくなります。
- 生成済み/未生成の表示
- 再生成の判断(いつ更新されたか、など)
“漏れなく回す”ための仕組みは、体感の改善に直結します。
4. ルールで守る領域を決める(AIに任せすぎない)
特にEC運用では、表現のガードが重要です。
- ブランド表記、法務/規約上のNG
- 業界規制(商材によっては表現制限)
- 競合名など、載せたくない語
このあたりはAI任せにせず、禁止語やルールで最終的に担保できる形にしておくと安心です。
まとめ
- サイト内検索が弱い原因は、検索エンジンよりも商品データ側の“語彙不足”であることが多い
- 表記ゆれ・類義語・用途語を吸収するには、商品ごとのキーワード整備が効く
- ただし人手だけでは継続が難しいため、商品情報からキーワード候補を自動生成し、運用に組み込むと回しやすい
- 出力形式の固定、単体/一括の分離、生成済み可視化、禁止語ルールなどが運用のカギ
当社ではこのような仕組みも実装しています
「キーワード整備が大事なのは分かるが、手作業では続かない」という課題に対して、当社ではAIによる検索キーワード自動生成機能を実装しています。
表記ゆれ・類義語・用途語を含めた候補を生成し、商品データとして保持することで、検索0件の削減やサジェスト改善などの取り組みを継続しやすくします。
サイト内検索の改善や、運用に載る形での仕組みづくりについて検討中の方は、お気軽にご相談ください。