SemanticGo is a Semantic Data Layer for AI Agents.

Build AI-Ready Data Layers
from Any Source.

비정형 데이터를 — AI Agent가 쿼리할 수 있는 Data Layer로 자동 변환합니다.

Works with Your Favorite Agent Framework

VannaLangChainLlamaIndexSnowflake CortexMicrosoft Power BIApache Spark

SemanticGo는 이들 도구에 입력될 깨끗한 DB와 분류 자산을 자동으로 만듭니다.

왜 LLM SQL Agent는 매번 다른 SQL을 만들까요?

Raw Schema
의미 없음
cd_001 VARCHAR
amt_01 NUMERIC
remark TEXT
LLM이 받는 것
SemanticGo
자동 변환
분류·매핑·근거 생성
AI Agent가 자동 수행
Data Layer
의미 있음
cd_001 → 정상
amt_01 → 매출(원)
remark → KSIC 47120
AI Agent가 쿼리 가능

LangChain SQL Agent · Vanna · Snowflake Cortex — 어떤 도구를 써도 raw DB에서는 SQL을 만들고 실패하기를 반복합니다. 이유는 LLM의 입력에 있습니다. LLM이 받는 것은 schema뿐 — 비즈니스 의미가 없습니다.

Schema가 알려주지 않는 4가지:

컬럼의 비즈니스 의미
amt_01이 매출인가, 환불인가, 세후 금액인가?
메트릭 정의
"이번 분기 매출"의 분기는 회계 분기인가 달력 분기인가?
코드값의 의미
cd_001 = '03'이 정상인가 폐기인가? 코드북은 schema에 없습니다.
자유 텍스트의 분류 의미
remark가 분류 의미를 담고 있어도, schema는 그냥 TEXT.

LLM은 위 4가지를 모른 채 추측해 SQL을 만듭니다. 매번 다른 SQL, 매번 다른 결과.

“Generic AI solutions often struggle with text-to-SQL conversions when given only a database schema, as schemas lack critical knowledge like business process definitions and metrics handling.”

데이터베이스 스키마만으로는 비즈니스 프로세스 정의나 메트릭 처리 같은 핵심 지식이 누락되기 때문에, 일반적인 AI 솔루션은 Text-to-SQL 변환에 어려움을 겪을 수밖에 없습니다.

— Snowflake Cortex Analyst 공식 진단

업계 결론은 명확합니다 — raw 데이터를 LLM에 직접 던지지 말고, Data Layer를 먼저 구축한 후 그 위에서 LLM이 작동하게 하라. Snowflake · Databricks · Microsoft 모두 같은 결론에 도달했습니다.

Data Layer 구축이란 — 각 컬럼(비즈니스 의미·메트릭·코드값)·행(분류 체계)·자유 텍스트를 정확한 분류와 의미로 매핑해 정형 DB에 적재하는 작업입니다. 이 분류 매핑이 핵심 어려움 — LLM이 도메인 약어·적용 원칙·과거 매핑 사례를 모르기 때문입니다. 사람이 직접 하면 1건당 1~4시간, 매년 수천 건, 외주 시 수천만~수억 원.

그 분류 매핑을 — 누가 자동화하는가?

SemanticGo의 답

사람의 매뉴얼 의미 추론에만 의존했던 데이터 준비 작업을, AI Agent가 대신 수행합니다. 결과는 NL2SQL/RAG 도구가 즉시 사용할 수 있는 형태로 출력되며, 모든 변환 결정의 근거가 audit 가능하게 보존됩니다.

1. Data Onboarding Included
핵심 차별화

비정형/반정형 데이터(Excel, CSV, PDF)를 자동으로 정형 DB로 적재.

기존 NL2SQL/RAG 도구가 전제하는 "이미 깨끗한 DB"를 자동 생성.

사용자는 원본 파일만 업로드하면 됩니다.

2. AI-Ready Output
다중 호환 출력

분류 결과는 Top-N 후보 + 신뢰도 + 자연어 근거 + 기여 키워드의 구조화된 형태.

그대로 다운스트림 도구의 입력으로 연계 가능.

분류 체계가 바뀌면 Domain Pack만 교체 — 재학습 0초.

3. Full Logic Trace
규제 산업 진입 기반

모든 변환 결정의 근거를 보존 정책에 따라 audit log에 저장.

"왜 이 행이 이 카테고리로 분류되었는가" 추적 가능.

분쟁·감사 시점 재현 — 공공·금융·의료 진입 필수 조건.

사용 흐름

한 눈에 흐름

1. Input
원본 파일 + Domain Pack
비정형 파일 업로드 + 분류 체계 선택
2. Process
AI 자동 분류 + HITL 검토
LLM이 Top-N 후보·신뢰도·근거 생성
3. Output
정형 DB + 다운스트림 연계
NL2SQL/RAG 도구 즉시 사용 가능

세부 단계

  1. 1
    원본 파일 업로드
    Excel / CSV / TSV / XLS
  2. 2
    분류 체계(Domain Pack) 선택
    분류 체계·용어 사전·매핑 규칙·Few-shot 사례를 묶은 자산. 예: KSIC·NAICS·MedDRA 사전 등록 또는 자체 정의
  3. 3
    텍스트 컬럼 지정
    분류 대상 컬럼 1개
  4. 4
    "분류 실행" 클릭
    LLM이 행마다 자동 매핑
  5. 5
    결과 확인
    Top-N 후보 + 신뢰도 + 자연어 근거
  6. 6
    다운스트림 연계
    audit log + 구조화 데이터 export

분류 체계가 바뀌어도 Domain Pack만 교체하면 즉시 재분류. 재학습·재배포 없음.

검토 자동화 수준 — Auto / Guided / Step

분류 결과를 어디까지 자동 통과시키고 어디서 사람이 확인할지, 워크플로우에 맞춰 선택합니다.

Auto
최종 검토만
신뢰도 낮은 항목만 표시되어 빠르게 통과. 빠른 PoC·실험에 적합.
Guided
의미 있는 게이트만 (기본값)
의미 있는 결정 게이트에서만 사용자 확인. 정확도와 속도의 균형.
Step
모든 결정 확인
모든 결정을 사용자가 확인. 감사·규제 환경에 적합.

작업 도중에도 모드를 전환할 수 있습니다. 같은 제품이 빠른 실험과 감사-grade 운영을 모두 수용합니다.

사용 시나리오

Scenario A
AI Agent 개발자
"고객사 데이터 1만 건을 자체 분류 체계에 매핑해야 하는데, 도메인 전문가가 없습니다. 기존 같으면 PoC를 포기할 작업입니다."

→ Domain Pack을 정의하고 파일을 업로드하면, 사람이 며칠 검토해야 했던 작업이 수 시간 내 완료됩니다. 저신뢰도 항목만 빠르게 검토·확정.

Scenario B
표준 분류 매핑 전문가
"산업·의약·의료·무역 등 표준 분류 체계에 신청 건씩 매핑하는 작업이 일상 업무입니다. 1건에 1~4시간, 매년 수천 건. 분류 체계는 주기적으로 개정됩니다."

→ Domain Pack(KSIC, NAICS, MedDRA, ICD-10, HS code 등)을 등록하고 과거 매핑 사례를 Few-shot으로 추가하면, 신청 건당 분 단위로 Top-N 후보 + 자연어 근거를 받아 검토·확정만 수행. 모든 결정이 immutable audit log에 보존되어 감사 시점 재현이 가능합니다.

자주 묻는 질문 (FAQ)

SemanticGo와 인접 도구의 관계를 명료화합니다.

Q.NL2SQL 도구와 어떻게 다른가요?

NL2SQL 인터페이스 자체가 아닙니다. SemanticGo는 NL2SQL 도구(Vanna · LangChain SQL Agent 등)가 전제하는 "깨끗한 DB · 학습 데이터"를 자동 생성하는 전처리 인프라입니다. 자체 NL2SQL 데모는 보조로만 제공합니다.

Q.BI 도구를 대체합니까?

아닙니다. 시각화·대시보드·리포트 생성은 제공하지 않습니다. 출력은 다른 BI 도구(Power BI · Tableau 등)가 즉시 소비할 수 있는 정형 형태로 제공합니다.

Q.데이터 거버넌스 플랫폼인가요?

아닙니다. PII 탐지·컴플라이언스 분류는 본 제품의 범위 밖입니다. 멀티 테넌트 격리는 인프라 차원(PostgreSQL RLS · schema 분리)에서 보장합니다.

Q.비개발자가 사용할 수 있나요?

웹 UI는 비개발자도 사용 가능합니다. 다만 핵심 가치는 AI Agent 개발자 · ML 엔지니어에게 있습니다 — Python/REST API · NL2SQL/RAG 도구 연계가 주된 사용 시나리오입니다.

Q.분류 모델을 파인튜닝하나요?

아닙니다. 사용자별 분류 체계에 맞춰 ML 모델을 파인튜닝하지 않습니다. LLM의 in-context 추론 + Domain Pack + Few-shot 학습으로 작동 — "50건 Few-shot으로 시작 가능, 분류 체계 변경에 즉시 대응, 자연어 근거 생성"의 기반입니다.

요금제

Free
Pro추천
Enterprise
타깃개인 개발자 · PoC 실험성장 AI 스타트업 · 소규모 팀금융 · 의료 · 공공 기관
월 가격₩0₩49,000맞춤
월 분류 행1005,000무제한
워크스페이스13맞춤
Domain Pack1무제한무제한
감사 보존3개월1년7년
HITL 검토 모드Auto+ Guided+ Step
API×+ SDK
SLA커뮤니티이메일99.9% + 전담
"모든 조직이 자신의 비정형 데이터를 AI Agent가 사용할 수 있는 자산으로 변환할 수 있게 합니다."

분류 체계가 자주 바뀌거나, 처음부터 다양한 도메인을 다루거나, 결정의 근거를 설명해야 하는 환경 — SemanticGo가 정확히 그 자리에 있습니다.