RAG(検索拡張生成)、ハイブリッド検索、リアルタイムストリーミングを実装したエンタープライズグレードのAI基盤技術
マイクロサービス設計による高可用性・スケーラブルな構成
Server-Sent Events (SSE) による低レイテンシ応答。ユーザーは生成と同時にテキストを確認可能。
2段階のツール実行フロー。検出→実行→結果統合の高度なオーケストレーション。
TypeScript Strict Mode + Zod によるランタイムバリデーション。コンパイル時と実行時の二重チェック。
Routes → Handlers → Services の明確な責務分離。テスタビリティと保守性を両立。
Retrieval-Augmented Generation による高精度な文脈理解
// RAG Processing Pipeline async function processRAGQuery(query: string): Promise<SearchResult[]> { // 1. Query Rewriting - 会話コンテキストを考慮した検索クエリ最適化 const rewrittenQuery = await rewriteQuery(query, conversationHistory); // 2. Intent Detection - クエリの意図を分類 const intent = detectIntent(rewrittenQuery); // → 'technical' | 'service' | 'company' | 'general' // 3. Parallel Search Execution const [vectorResults, keywordResults] = await Promise.all([ vectorSearch(rewrittenQuery), // Semantic: 768-dim cosine similarity bm25Search(rewrittenQuery) // Lexical: BM25+ with K1=1.2, B=0.75 ]); // 4. Reciprocal Rank Fusion const fusedResults = applyRRF(vectorResults, keywordResults, { k: 60, weights: getIntentWeights(intent) }); // 5. Relevance Filtering return fusedResults.filter(r => r.score >= RELEVANCE_THRESHOLD); }
WordPressコンテンツを自動取得し、セマンティックチャンキング(500文字単位)で分割。 TF-IDF統計とベクトル埋め込みを同時生成。
クエリの意図を自動分類し、検索アルゴリズムの重み付けを動的調整。 技術質問はセマンティック重視、会社情報はキーワード重視。
ベクトル検索とキーワード検索を融合した高精度検索エンジン
| Algorithm | Method | Parameters | Use Case |
|---|---|---|---|
| Vector Search | Cosine Similarity | threshold: 0.3, dim: 768 | 意味的類似性、抽象的な質問 |
| BM25+ Search | TF-IDF Scoring | K1: 1.2, B: 0.75, δ: 1.0 | キーワードマッチ、固有名詞 |
| RRF Fusion | Reciprocal Rank | K: 60 | 複合クエリ、ランキング統合 |
768次元の密ベクトル空間でコサイン類似度を計算。意味的に近いコンテンツを高速に発見。
改良版BM25アルゴリズム。飽和パラメータと文書長正規化により、精度を向上。
Reciprocal Rank Fusion で両検索結果を統合。順位ベースの堅牢なスコアリング。
多層防御によるエンタープライズグレードのセキュリティ
許可されたオリジンのみからのリクエストを受け付け。ワイルドカードを使用しない厳格なCORS設定。
IP単位で30リクエスト/分の制限。分散攻撃に対する自動スロットリング。
Zodスキーマによるランタイム検証。最大2000文字/メッセージ、50メッセージ/会話の制限。
管理APIはBearer Token認証必須。環境変数による秘密鍵管理。
モダンで堅牢な技術選定
エンタープライズグレードのAI技術を、今すぐ試せます。