YUA Technical Architecture

System Design

システムアーキテクチャ

マイクロサービス設計による高可用性・スケーラブルな構成

Request Flow

User Query

→

Security Layer

→

Request Validation

↓

Query Rewriting

→

Intent Detection

↓

Vector Search

Semantic Matching
768-dim Embeddings

BM25+ Search

Lexical Matching
TF-IDF Scoring

↓

RRF Fusion

→

LLM Processing

→

Streaming Response

リアルタイムストリーミング

Server-Sent Events (SSE) による低レイテンシ応答。ユーザーは生成と同時にテキストを確認可能。

SSE ReadableStream Progressive Rendering

ツールコーリング

2段階のツール実行フロー。検出→実行→結果統合の高度なオーケストレーション。

Function Calling JSON Schema Parallel Execution

型安全設計

TypeScript Strict Mode + Zod によるランタイムバリデーション。コンパイル時と実行時の二重チェック。

TypeScript 5.9 Zod Schemas Strict Mode

レイヤードアーキテクチャ

Routes → Handlers → Services の明確な責務分離。テスタビリティと保守性を両立。

Clean Architecture Dependency Injection SoC

Core Technology

RAG システム

Retrieval-Augmented Generation による高精度な文脈理解

rag-pipeline.ts

// RAG Processing Pipeline
async function processRAGQuery(query: string): Promise<SearchResult[]> {
  // 1. Query Rewriting - 会話コンテキストを考慮した検索クエリ最適化
  const rewrittenQuery = await rewriteQuery(query, conversationHistory);

  // 2. Intent Detection - クエリの意図を分類
  const intent = detectIntent(rewrittenQuery);
  // → 'technical' | 'service' | 'company' | 'general'

  // 3. Parallel Search Execution
  const [vectorResults, keywordResults] = await Promise.all([
    vectorSearch(rewrittenQuery),    // Semantic: 768-dim cosine similarity
    bm25Search(rewrittenQuery)        // Lexical: BM25+ with K1=1.2, B=0.75
  ]);

  // 4. Reciprocal Rank Fusion
  const fusedResults = applyRRF(vectorResults, keywordResults, {
    k: 60,
    weights: getIntentWeights(intent)
  });

  // 5. Relevance Filtering
  return fusedResults.filter(r => r.score >= RELEVANCE_THRESHOLD);
}

インデックス生成

WordPressコンテンツを自動取得し、セマンティックチャンキング（500文字単位）で分割。 TF-IDF統計とベクトル埋め込みを同時生成。

Semantic Chunking TF-IDF Auto-sync

インテント認識

クエリの意図を自動分類し、検索アルゴリズムの重み付けを動的調整。技術質問はセマンティック重視、会社情報はキーワード重視。

Intent Classification Dynamic Weighting Context Boost

Search Engine

ハイブリッド検索

ベクトル検索とキーワード検索を融合した高精度検索エンジン

Algorithm	Method	Parameters	Use Case
Vector Search	Cosine Similarity	threshold: 0.3, dim: 768	意味的類似性、抽象的な質問
BM25+ Search	TF-IDF Scoring	K1: 1.2, B: 0.75, δ: 1.0	キーワードマッチ、固有名詞
RRF Fusion	Reciprocal Rank	K: 60	複合クエリ、ランキング統合

🔍

ベクトル検索

768次元の密ベクトル空間でコサイン類似度を計算。意味的に近いコンテンツを高速に発見。

📊

BM25+

改良版BM25アルゴリズム。飽和パラメータと文書長正規化により、精度を向上。

⚡

RRF Fusion

Reciprocal Rank Fusion で両検索結果を統合。順位ベースの堅牢なスコアリング。

Security

セキュリティアーキテクチャ

多層防御によるエンタープライズグレードのセキュリティ

🔒

Origin Validation

許可されたオリジンのみからのリクエストを受け付け。ワイルドカードを使用しない厳格なCORS設定。

CORS Whitelist

⏱️

Rate Limiting

IP単位で30リクエスト/分の制限。分散攻撃に対する自動スロットリング。

30 req/min Per-IP

✅

Input Validation

Zodスキーマによるランタイム検証。最大2000文字/メッセージ、50メッセージ/会話の制限。

Zod Schema Length Limits

🔑

API Authentication

管理APIはBearer Token認証必須。環境変数による秘密鍵管理。

Bearer Token Env Vars

Stack

技術スタック

モダンで堅牢な技術選定

Next.js 16

App Router / React 19

TypeScript 5.9

Strict Mode

Tailwind CSS 4

Utility-First

Vercel

Edge Network

Vercel Blob

Object Storage

Zod

Schema Validation

システムアーキテクチャ

Request Flow

リアルタイムストリーミング

ツールコーリング

型安全設計

レイヤードアーキテクチャ

RAG システム

インデックス生成

インテント認識

ハイブリッド検索

ベクトル検索

BM25+

RRF Fusion

セキュリティアーキテクチャ

Origin Validation

Rate Limiting

Input Validation

API Authentication

技術スタック

YUA を体験する