Works with Your Favorite Agent Framework
SemanticGo는 이들 도구에 입력될 깨끗한 DB와 분류 자산을 자동으로 만듭니다.
왜 LLM SQL Agent는 매번 다른 SQL을 만들까요?
LangChain SQL Agent · Vanna · Snowflake Cortex — 어떤 도구를 써도 raw DB에서는 SQL을 만들고 실패하기를 반복합니다. 이유는 LLM의 입력에 있습니다. LLM이 받는 것은 schema뿐 — 비즈니스 의미가 없습니다.
Schema가 알려주지 않는 4가지:
amt_01이 매출인가, 환불인가, 세후 금액인가?cd_001 = '03'이 정상인가 폐기인가? 코드북은 schema에 없습니다.remark가 분류 의미를 담고 있어도, schema는 그냥 TEXT.LLM은 위 4가지를 모른 채 추측해 SQL을 만듭니다. 매번 다른 SQL, 매번 다른 결과.
“Generic AI solutions often struggle with text-to-SQL conversions when given only a database schema, as schemas lack critical knowledge like business process definitions and metrics handling.”
데이터베이스 스키마만으로는 비즈니스 프로세스 정의나 메트릭 처리 같은 핵심 지식이 누락되기 때문에, 일반적인 AI 솔루션은 Text-to-SQL 변환에 어려움을 겪을 수밖에 없습니다.
— Snowflake Cortex Analyst 공식 진단
업계 결론은 명확합니다 — raw 데이터를 LLM에 직접 던지지 말고, Data Layer를 먼저 구축한 후 그 위에서 LLM이 작동하게 하라. Snowflake · Databricks · Microsoft 모두 같은 결론에 도달했습니다.
Data Layer 구축이란 — 각 컬럼(비즈니스 의미·메트릭·코드값)·행(분류 체계)·자유 텍스트를 정확한 분류와 의미로 매핑해 정형 DB에 적재하는 작업입니다. 이 분류 매핑이 핵심 어려움 — LLM이 도메인 약어·적용 원칙·과거 매핑 사례를 모르기 때문입니다. 사람이 직접 하면 1건당 1~4시간, 매년 수천 건, 외주 시 수천만~수억 원.
그 분류 매핑을 — 누가 자동화하는가?
SemanticGo의 답
사람의 매뉴얼 의미 추론에만 의존했던 데이터 준비 작업을, AI Agent가 대신 수행합니다. 결과는 NL2SQL/RAG 도구가 즉시 사용할 수 있는 형태로 출력되며, 모든 변환 결정의 근거가 audit 가능하게 보존됩니다.
비정형/반정형 데이터(Excel, CSV, PDF)를 자동으로 정형 DB로 적재.
기존 NL2SQL/RAG 도구가 전제하는 "이미 깨끗한 DB"를 자동 생성.
사용자는 원본 파일만 업로드하면 됩니다.
분류 결과는 Top-N 후보 + 신뢰도 + 자연어 근거 + 기여 키워드의 구조화된 형태.
그대로 다운스트림 도구의 입력으로 연계 가능.
분류 체계가 바뀌면 Domain Pack만 교체 — 재학습 0초.
모든 변환 결정의 근거를 보존 정책에 따라 audit log에 저장.
"왜 이 행이 이 카테고리로 분류되었는가" 추적 가능.
분쟁·감사 시점 재현 — 공공·금융·의료 진입 필수 조건.
사용 흐름
한 눈에 흐름
세부 단계
- 1원본 파일 업로드Excel / CSV / TSV / XLS
- 2분류 체계(Domain Pack) 선택분류 체계·용어 사전·매핑 규칙·Few-shot 사례를 묶은 자산. 예: KSIC·NAICS·MedDRA 사전 등록 또는 자체 정의
- 3텍스트 컬럼 지정분류 대상 컬럼 1개
- 4"분류 실행" 클릭LLM이 행마다 자동 매핑
- 5결과 확인Top-N 후보 + 신뢰도 + 자연어 근거
- 6다운스트림 연계audit log + 구조화 데이터 export
분류 체계가 바뀌어도 Domain Pack만 교체하면 즉시 재분류. 재학습·재배포 없음.
검토 자동화 수준 — Auto / Guided / Step
분류 결과를 어디까지 자동 통과시키고 어디서 사람이 확인할지, 워크플로우에 맞춰 선택합니다.
작업 도중에도 모드를 전환할 수 있습니다. 같은 제품이 빠른 실험과 감사-grade 운영을 모두 수용합니다.
사용 시나리오
"고객사 데이터 1만 건을 자체 분류 체계에 매핑해야 하는데, 도메인 전문가가 없습니다. 기존 같으면 PoC를 포기할 작업입니다."
→ Domain Pack을 정의하고 파일을 업로드하면, 사람이 며칠 검토해야 했던 작업이 수 시간 내 완료됩니다. 저신뢰도 항목만 빠르게 검토·확정.
"산업·의약·의료·무역 등 표준 분류 체계에 신청 건씩 매핑하는 작업이 일상 업무입니다. 1건에 1~4시간, 매년 수천 건. 분류 체계는 주기적으로 개정됩니다."
→ Domain Pack(KSIC, NAICS, MedDRA, ICD-10, HS code 등)을 등록하고 과거 매핑 사례를 Few-shot으로 추가하면, 신청 건당 분 단위로 Top-N 후보 + 자연어 근거를 받아 검토·확정만 수행. 모든 결정이 immutable audit log에 보존되어 감사 시점 재현이 가능합니다.
자주 묻는 질문 (FAQ)
SemanticGo와 인접 도구의 관계를 명료화합니다.
Q.NL2SQL 도구와 어떻게 다른가요?▾
NL2SQL 인터페이스 자체가 아닙니다. SemanticGo는 NL2SQL 도구(Vanna · LangChain SQL Agent 등)가 전제하는 "깨끗한 DB · 학습 데이터"를 자동 생성하는 전처리 인프라입니다. 자체 NL2SQL 데모는 보조로만 제공합니다.
Q.BI 도구를 대체합니까?▾
아닙니다. 시각화·대시보드·리포트 생성은 제공하지 않습니다. 출력은 다른 BI 도구(Power BI · Tableau 등)가 즉시 소비할 수 있는 정형 형태로 제공합니다.
Q.데이터 거버넌스 플랫폼인가요?▾
아닙니다. PII 탐지·컴플라이언스 분류는 본 제품의 범위 밖입니다. 멀티 테넌트 격리는 인프라 차원(PostgreSQL RLS · schema 분리)에서 보장합니다.
Q.비개발자가 사용할 수 있나요?▾
웹 UI는 비개발자도 사용 가능합니다. 다만 핵심 가치는 AI Agent 개발자 · ML 엔지니어에게 있습니다 — Python/REST API · NL2SQL/RAG 도구 연계가 주된 사용 시나리오입니다.
Q.분류 모델을 파인튜닝하나요?▾
아닙니다. 사용자별 분류 체계에 맞춰 ML 모델을 파인튜닝하지 않습니다. LLM의 in-context 추론 + Domain Pack + Few-shot 학습으로 작동 — "50건 Few-shot으로 시작 가능, 분류 체계 변경에 즉시 대응, 자연어 근거 생성"의 기반입니다.
요금제
| Free | Pro추천 | Enterprise | |
|---|---|---|---|
| 타깃 | 개인 개발자 · PoC 실험 | 성장 AI 스타트업 · 소규모 팀 | 금융 · 의료 · 공공 기관 |
| 월 가격 | ₩0 | ₩49,000 | 맞춤 |
| 월 분류 행 | 100 | 5,000 | 무제한 |
| 워크스페이스 | 1 | 3 | 맞춤 |
| Domain Pack | 1 | 무제한 | 무제한 |
| 감사 보존 | 3개월 | 1년 | 7년 |
| HITL 검토 모드 | Auto | + Guided | + Step |
| API | × | ○ | + SDK |
| SLA | 커뮤니티 | 이메일 | 99.9% + 전담 |
"모든 조직이 자신의 비정형 데이터를 AI Agent가 사용할 수 있는 자산으로 변환할 수 있게 합니다."
분류 체계가 자주 바뀌거나, 처음부터 다양한 도메인을 다루거나, 결정의 근거를 설명해야 하는 환경 — SemanticGo가 정확히 그 자리에 있습니다.