Try YUA
Enterprise AI Platform

YUA Technical Architecture

RAG(検索拡張生成)、ハイブリッド検索、リアルタイムストリーミングを実装したエンタープライズグレードのAI基盤技術

768
次元ベクトル
<100ms
検索レイテンシ
99.9%
可用性

システムアーキテクチャ

マイクロサービス設計による高可用性・スケーラブルな構成

Request Flow

User Query
Security Layer
Request Validation
Query Rewriting
Intent Detection
Vector Search
Semantic Matching
768-dim Embeddings
BM25+ Search
Lexical Matching
TF-IDF Scoring
RRF Fusion
LLM Processing
Streaming Response

リアルタイムストリーミング

Server-Sent Events (SSE) による低レイテンシ応答。ユーザーは生成と同時にテキストを確認可能。

SSE ReadableStream Progressive Rendering

ツールコーリング

2段階のツール実行フロー。検出→実行→結果統合の高度なオーケストレーション。

Function Calling JSON Schema Parallel Execution

型安全設計

TypeScript Strict Mode + Zod によるランタイムバリデーション。コンパイル時と実行時の二重チェック。

TypeScript 5.9 Zod Schemas Strict Mode

レイヤードアーキテクチャ

Routes → Handlers → Services の明確な責務分離。テスタビリティと保守性を両立。

Clean Architecture Dependency Injection SoC

RAG システム

Retrieval-Augmented Generation による高精度な文脈理解

rag-pipeline.ts
// RAG Processing Pipeline
async function processRAGQuery(query: string): Promise<SearchResult[]> {
  // 1. Query Rewriting - 会話コンテキストを考慮した検索クエリ最適化
  const rewrittenQuery = await rewriteQuery(query, conversationHistory);

  // 2. Intent Detection - クエリの意図を分類
  const intent = detectIntent(rewrittenQuery);
  // → 'technical' | 'service' | 'company' | 'general'

  // 3. Parallel Search Execution
  const [vectorResults, keywordResults] = await Promise.all([
    vectorSearch(rewrittenQuery),    // Semantic: 768-dim cosine similarity
    bm25Search(rewrittenQuery)        // Lexical: BM25+ with K1=1.2, B=0.75
  ]);

  // 4. Reciprocal Rank Fusion
  const fusedResults = applyRRF(vectorResults, keywordResults, {
    k: 60,
    weights: getIntentWeights(intent)
  });

  // 5. Relevance Filtering
  return fusedResults.filter(r => r.score >= RELEVANCE_THRESHOLD);
}

インデックス生成

WordPressコンテンツを自動取得し、セマンティックチャンキング(500文字単位)で分割。 TF-IDF統計とベクトル埋め込みを同時生成。

Semantic Chunking TF-IDF Auto-sync

インテント認識

クエリの意図を自動分類し、検索アルゴリズムの重み付けを動的調整。 技術質問はセマンティック重視、会社情報はキーワード重視。

Intent Classification Dynamic Weighting Context Boost

セキュリティアーキテクチャ

多層防御によるエンタープライズグレードのセキュリティ

🔒

Origin Validation

許可されたオリジンのみからのリクエストを受け付け。ワイルドカードを使用しない厳格なCORS設定。

CORS Whitelist
⏱️

Rate Limiting

IP単位で30リクエスト/分の制限。分散攻撃に対する自動スロットリング。

30 req/min Per-IP

Input Validation

Zodスキーマによるランタイム検証。最大2000文字/メッセージ、50メッセージ/会話の制限。

Zod Schema Length Limits
🔑

API Authentication

管理APIはBearer Token認証必須。環境変数による秘密鍵管理。

Bearer Token Env Vars

技術スタック

モダンで堅牢な技術選定

Next.js 16
App Router / React 19
TypeScript 5.9
Strict Mode
Tailwind CSS 4
Utility-First
Vercel
Edge Network
Vercel Blob
Object Storage
Zod
Schema Validation

YUA を体験する

エンタープライズグレードのAI技術を、今すぐ試せます。

Try YUA → AI開発について