Company Bites — AI 테크 & 논문 리뷰
🧵 Threads

LLM 13명이 토론하는 가상 헤지펀드와, 45개 거래소 데이터로 학습한 K-line 파운데이션 모델. 전혀 다른 두 접근을 내 자동거래 앱에 붙여봤다.

AI 트레이딩 오픈소스: ai-hedge-fund vs Kronos 설계기 - Company Bites 심층분석

2. Kronos — 캔들차트의 "다음 단어"를 예측하는 파운데이션 모델
3. 두 접근의 차이 정리
4. 내 트레이딩 앱에 어떻게 붙일 것인가
5. 후기 (실측 데이터 업데이트 예정)
자주 묻는 질문 (FAQ)
마무리: "AI 트레이딩"의 실전 설계 원칙

LLM 13명이 토론하는 ai-hedge-fund(5.6만★)와 캔들차트를 토큰으로 예측하는 Kronos(1.9만★, AAAI 2026). 두 오픈소스를 KIS OpenAPI 기반 자동거래 앱에 어떻게 붙일지 — VWAP+오더플로 파이프라인, Kelly 분수, ATR 리스크 캡까지 실전 설계.

이 글에서 다루는 것: 2026년 1분기에 주목받은 "AI × 금융 시장" 오픈소스 두 가지를 뜯어본다. virattt/ai-hedge-fund는 멀티 에이전트 LLM 토론으로 투자 판단을 모사하고, shiyu-coder/Kronos는 차트 패턴 자체를 예측하는 파운데이션 모델이다. 두 도구의 철학 차이, 내가 만들고 있는 한국투자증권 API 기반 데이트레이딩 앱에 어떻게 붙일 계획인지, 그리고 실제 백테스트 후기(업데이트 예정)까지 정리한다.

⚠️ 투자 자문이 아닙니다. 이 글은 오픈소스 분석과 개인 프로젝트 설계 메모입니다. 실거래 손익은 본인 책임이며, 자금·세무·법률 판단은 반드시 전문가 상담을 거치십시오. 글 내 모든 수치(승률·기댓값 등)는 가정치이거나 미실측 목표치입니다.

LLM으로 트레이딩을 하려는 시도는 새롭지 않다. 2023년부터 "ChatGPT에게 종목을 물어보면 수익이 난다더라"류의 실험이 수없이 돌았고, 대부분 실패했다. 이유는 명확하다. 범용 LLM은 시계열 감각이 없다. 어제 뉴스와 오늘 뉴스를 같은 우선순위로 취급하고, 가격 시계열을 텍스트로 풀어 넣으면 토큰이 폭발한다. "적정 주가"를 물어보면 학습 커트오프 이전의 과거 평균을 되풀이할 뿐이다.

2026년 초, 이 한계를 서로 다른 방식으로 뚫으려는 오픈소스 두 개가 동시에 떴다.

virattt/ai-hedge-fund — LLM을 의사결정 주체가 아닌 페르소나 기반 투표자로 쓴다
shiyu-coder/Kronos — 아예 LLM이 아닌 금융 시계열 전용 트랜스포머를 프리트레인한다

두 접근은 정반대다. 하나는 "사람을 모사"하고, 하나는 "사람 없이 패턴만 본다". 이 글에선 두 프로젝트의 구조를 뜯어보고, 내가 Claude Code로 반년째 만들고 있는 한국·미국 데이트레이딩 앱(KIS OpenAPI 기반)에 어떻게 접목할지 설계까지 다룬다.

1. ai-hedge-fund — LLM 13명이 토론하는 가상 헤지펀드

AI 트레이딩 오픈소스: ai-hedge-fund vs Kronos 설계기 - ai-hedge-fund

GitHub: github.com/virattt/ai-hedge-fund (56.1k+ stars · MIT)

19개의 AI 에이전트(13명 투자가 페르소나 + 4명 분석가 + 2명 매니지먼트)가 협업해 매수·매도 의사결정을 시뮬레이션하는 교육·연구용 오픈소스 헤지펀드.

구조

이 프로젝트는 "LLM 하나가 투자 판단을 내리게 한다"는 기존 실험과 다르다. 19명의 역할을 가진 에이전트가 분업한다.

13명의 투자가 페르소나 (README #1~#13 순서)

Aswath Damodaran (Dean of Valuation)
Ben Graham (안전마진·가치투자의 시조)
Bill Ackman (행동주의)
Cathie Wood (혁신·고성장)
Charlie Munger ("훌륭한 기업을 적정가에")
Michael Burry (Big Short식 역발상·딥밸류)
Mohnish Pabrai (Dhandho·체크리스트 투자)
Nassim Taleb (Black Swan·꼬리위험·반취약성)
Peter Lynch (10루타·GARP)
Phil Fisher (scuttlebutt — 현장 탐문 리서치)
Rakesh Jhunjhunwala (Big Bull of India)
Stanley Druckenmiller (매크로)
Warren Buffett (장기 가치투자)

4명의 분석 에이전트

Fundamental Analyst (재무제표·ROE·부채비율)
Valuation Analyst (DCF·멀티플)
Sentiment Analyst (뉴스·SNS 톤)
Technical Analyst (차트·모멘텀)

2명의 매니지먼트

Risk Manager (포지션 사이즈·VaR)
Portfolio Manager (최종 결정·집행)

어떻게 돌아가나

사용자가 종목 티커(예: AAPL)를 입력하면:

1. 4명 분석가가 각자 관점으로 데이터 수집 & 요약
2. 13명 투자가 페르소나가 각자의 철학으로 매수/중립/매도 투표
3. Risk Manager가 포지션 한도 계산
4. Portfolio Manager가 모든 의견을 종합해 최종 결정

각 페르소나는 그 투자가의 공개 원칙(저서·인터뷰·주주서한)을 시스템 프롬프트에 넣어 역할극을 시킨다. 버핏은 경제적 해자를, 버리는 파산 확률을, 캐시 우드는 혁신 S커브를, 탈레브는 꼬리위험과 반취약성을 본다.

실행 환경

Poetry CLI — poetry run python src/main.py --ticker AAPL
Web UI — /app 디렉토리의 Vite + FastAPI 풀스택 앱
백테스트 — 과거 날짜 구간 지정해 시뮬레이션
LLM — OpenAI, Anthropic, Groq, DeepSeek 중 선택

한계와 원저자의 경고

README 최상단에 "FOR EDUCATIONAL AND RESEARCH PURPOSES ONLY. DO NOT USE FOR REAL TRADING OR INVESTMENT" 가 박혀 있다. 저자가 명시하는 한계는 세 가지다.

페르소나 모사는 본질적으로 근사치다. 실제 버핏이 2026년 AAPL을 보고 어떻게 판단할지는 아무도 모른다.
LLM은 학습 커트오프 이후의 재무 데이터를 알 수 없다. 최근 분기 실적은 외부 API(FinancialDatasets, Alpha Vantage 등)로 주입해야 한다.
토론 프로세스가 재현 가능하지 않다. temperature>0이면 같은 입력에도 결과가 달라진다.

그래도 이 프로젝트가 5만 6천 스타를 넘긴 이유는 따로 있다. 보고 나면 이해된다. 멀티 에이전트 아키텍처 학습 레퍼런스로서 가치가 크다는 점이다. LLM을 "판단 주체"가 아닌 "관점 제공자"로 쓰는 설계, 그들의 의견을 "매니저 에이전트가 종합"하는 패턴은 다른 도메인에도 그대로 이식된다.

2. Kronos — 캔들차트의 "다음 단어"를 예측하는 파운데이션 모델

AI 트레이딩 오픈소스: ai-hedge-fund vs Kronos 설계기 - Kronos

GitHub: github.com/shiyu-coder/Kronos (19.2k+ stars · MIT · AAAI 2026 accepted)

45개 글로벌 거래소의 K-line(캔들스틱) 데이터로 프리트레인된, 오픈소스 금융 특화 디코더 트랜스포머 중 가장 주목받는 모델. OHLCV를 이산 토큰으로 변환해 "다음 캔들"을 예측한다.

발상

GPT는 "다음 단어"를 예측하도록 학습해서 언어를 이해한다. Kronos는 같은 아이디어를 캔들차트에 적용한다. 과거 N개의 캔들(OHLCV — 시가·고가·저가·종가·거래량)을 보고 다음 M개 캔들을 예측하도록 학습했다.

범용 시계열 모델(Chronos, TimeGPT, Moirai)과의 차이는 도메인 특화다. 금융 시계열은 다른 시계열과 성질이 다르다.

극심한 고노이즈 — 신호 대 잡음비(SNR)가 날씨·에너지 소비보다 훨씬 낮음
비정상성(non-stationarity) — 평균·분산이 체제 전환(regime shift, 시장의 통계적 성질이 바뀌는 구간 — 예: 강세장↔약세장) 마다 바뀜
두꺼운 꼬리 분포 — 정규분포 가정이 깨짐(블랙스완)
다중 시간 스케일 상호작용 — 5분봉·일봉·주봉이 서로 영향

이런 특성을 살려 설계하려면 처음부터 금융 데이터로 프리트레인한 모델이 필요하다. 그게 Kronos다.

구조 (2단계)

단계 1 — Hierarchical discrete tokenizer

연속값인 OHLCV 벡터를 한 시점 단위로 묶어 이산 토큰으로 변환한다(공식 표현은 "hierarchical discrete tokens"). 가격과 거래량을 분리해서 토큰화하는 대신, 한 캔들을 통째로 이산화해 시점 간 관계를 보존한다. 단순 K-bin 정규화보다 정보 손실이 적다. 양자화 알고리즘 세부는 arXiv:2508.02739 3장 참조.

단계 2 — 디코더 트랜스포머

토큰화된 시퀀스를 받아 다음 토큰을 자기회귀(autoregressive)로 예측한다. 구조는 GPT 계열과 유사하다. 세부 어텐션·포지셔널 인코딩 변경 사항은 논문을 보면 된다.

Model Zoo (4종 정의 · 3종 공개)

모델	파라미터	Tokenizer	Context length	공개	용도
Kronos-mini	4.1M	Kronos-Tokenizer-2k	2048	✅	엣지 디바이스, 실시간 추론
Kronos-small	24.7M	Kronos-Tokenizer-base	512	✅	일반 연구·백테스트
Kronos-base	102.3M	Kronos-Tokenizer-base	512	✅	대형 파인튜닝
Kronos-large	499.2M	Kronos-Tokenizer-base	512	❌ 비공개	—

공개 3종은 모두 Hugging Face NeoQuasar 컬렉션에 MIT 라이선스로 올라가 있다. 상업적 이용에 제한이 없다. horizon(예측 길이)은 모델 파라미터가 아니라 추론 시 지정하는 값으로, 예제 코드는 lookback=400, pred_len=120을 사용한다.

제공 파이프라인

레포에 함께 있는 것들:

배치 예측 스크립트 — CSV로 들어온 OHLCV에 대해 N봉 예측을 일괄 출력
파인튜닝 가이드 — 자체 데이터로 재학습하는 방법
백테스트 파이프라인 — 예측을 활용한 전략 검증
웹 UI — 브라우저에서 차트 + 예측 시각화
BTC/USDT 라이브 데모 — 실시간 예측 서비스

한계

Kronos도 완벽하지 않다.

5분봉 이하 초고빈도(HFT)는 학습 데이터 부족. 주봉·일봉·시간봉·분봉까지는 안정적
거시 이벤트(FOMC·실적발표)는 못 본다. 가격 시계열 외 데이터는 입력되지 않음
과거 체제에서 학습된 패턴이 미래에 통한다는 보장 없음. 모든 통계 모델의 공통 한계

3. 두 접근의 차이 정리

항목	ai-hedge-fund	Kronos
입력	재무제표·뉴스·차트 텍스트	OHLCV 시계열만
출력	매수/중립/매도 + 논리	다음 N봉의 가격 분포
모델	범용 LLM × 19 (GPT·Claude 등)	금융 전용 디코더 트랜스포머
추론 비용	높음 (토큰 요금)	낮음 (온디바이스 가능)
재현성	낮음 (temperature·시드 의존)	높음 (결정론적)
강점	맥락 설명·멀티 관점	패턴 예측·저비용 고속
약점	느림·비쌈·최신 데이터 수동 주입	펀더멘털·뉴스 무시
적합 용도	장기 투자 리서치·교육	단기 트레이딩 신호·백테스트

핵심 통찰: 두 모델은 경쟁 관계가 아니다. 보완 관계다. Kronos는 "무엇이 일어날까"를 예측하고, ai-hedge-fund는 "왜 그런 판단을 내리는지" 설명한다. 실전 트레이딩 시스템에 둘 다 붙이면 예측 + 설명 + 합의 3단계 구조가 생긴다.

4. 내 트레이딩 앱에 어떻게 붙일 것인가

솔직하게 밝히면, 나는 Claude Code 기반 한국투자증권(KIS) OpenAPI 자동거래 앱을 반년째 만들고 있다. 한국 주식(낮) + 미국 주식(밤), 당일 청산 데이트레이딩, VWAP + 오더플로 조합이 핵심 전략이다. 이미 Scheduler·Strategy·Orderflow·Risk·News·Execution 등 멀티 에이전트 구조로 설계되어 있다.

여기에 위 두 오픈소스를 붙이는 계획을 아래에 정리한다. 모두 실제 모의투자 환경에서 검증 후 실거래에 올릴 예정이다.

4-1. Kronos 접목 계획: Signal 보강기

위치: money/ml/kronos_predictor.py 신규 모듈

현재 내 앱의 Strategy Agent는 당일 누적 VWAP(거래량 가중 평균가 — 당일 시초부터 누적한 평균체결가) ± (20봉 롤링 표준편차) 구간 판단으로 진입 후보를 고르고, Orderflow Agent가 체결강도·호가 잔량으로 타이밍을 잡는다. 여기에 Kronos 예측을 제3의 확률 가중치로 합성한다.

# 의사 코드 — Kronos-small 기준 (lookback ≤ 512)
past_candles = get_last_n_candles(ticker, n=256, interval="5m")
prediction = kronos.predict(past_candles, pred_len=6)  # 6개 미래 캔들

up_probability = prediction.direction_probability(direction="up")

if vwap_signal == "long_candidate" and orderflow_signal == "buy_pressure":
    if up_probability >= 0.60:
        size_factor = 1.0    # 풀 포지션
    elif up_probability >= 0.55:
        size_factor = 0.5    # 하프 포지션
    else:
        size_factor = 0.0    # 진입 보류

# 실제 포지션은 Kelly 분수와 ATR 손절 폭을 함께 고려
# - Kelly 분수: 승률·평균손익비 기반 최적 베팅 비율 (보통 1/4 Kelly로 보수적용)
# - ATR(Average True Range): 평균 실질 변동폭 — 변동성 기반 손절 폭 산정용 지표
position_size = min(
    account_equity * size_factor * kelly_fraction(win_rate, avg_win_loss_ratio),
    account_equity * max_risk_per_trade,   # 거래당 자본 대비 상한 (예: 1%)
    account_equity * max_leverage_cap,     # 계좌 레버리지 상한
)

즉, 기존 2중 필터(VWAP + 오더플로)를 3중 필터(VWAP + 오더플로 + Kronos)로 확장한다. 확률이 Kelly 분수의 입력 중 하나일 뿐이라, 확률 → 사이즈 직결이 아니라 확률 → Kelly 프랙션 → 리스크 상한 클립의 순서로 돌린다.

선택한 이유:

Kronos-small(24.7M)은 MLX 또는 CoreML로 변환하면 M1 Mac에서 autoregressive 6스텝 기준 P95 200ms 이하를 목표로 잡을 수 있는 규모다(Metal 가속 전제, 실측 전 추정)
MIT 라이선스라 상업적 이용에 제약 없음
5분봉은 Kronos가 안정적으로 커버하는 해상도 범위(분봉 이하 초고빈도는 학습 데이터 부족)

검증 방법:

KIS OpenAPI로 한국 주식 5분봉 6개월치 수집(pykrx는 일봉 중심이라 분봉은 KIS에서 받고, pykrx는 종목 리스트·상장폐지·휴장일 캘린더 필터에만 사용). 미국 주식은 KIS 해외주식 분봉 API + 보조로 yfinance로 보강
시간대 처리: 한국장 09:00~15:20 KST, 미국장 23:30~05:50 KST(서머타임 자동 보정), DST 경계일은 백테스트에서 별도 검증 케이스로 분리
Kronos 필터 on/off 두 버전 → Profit Factor(총이익÷총손실), Expectancy(거래당 기댓값), Sortino(하방 변동성 기준 위험조정수익), MDD(최대 낙폭), Avg Win/Avg Loss 5개 지표로 비교
up_probability 임계치를 0.50 / 0.55 / 0.60 / 0.65로 스윕해 최적값 탐색
슬리피지 1~3bps 가정을 백테스트에 명시 주입. KIS 모의투자의 체결은 실거래보다 낙관적이라 따로 마진을 둔다

4-2. ai-hedge-fund 접목 계획: 일일 종목 화이트리스트 압축

위치: money/signals/persona_council.py 신규 모듈 + Scheduler 장시작 전 훅

ai-hedge-fund를 그대로 쓰기엔 장벽이 있다. 이 프로젝트는 장기 투자 관점의 페르소나가 중심이라 데이트레이딩과는 그대로 안 맞는다. 버핏 페르소나에게 5분봉 스캘핑 판단을 물어볼 수는 없다.

그래서 일부만 차용한다. 장 시작 전 모멘텀 스코어링으로 뽑힌 후보 10~20종목을, ai-hedge-fund의 분석가 4인(펀더멘털·밸류에이션·센티멘트·기술)에만 돌린다. 페르소나 13명은 제외한다. 출력은 "이 종목을 오늘 데이트레이딩 화이트리스트에 포함할지" 이진 투표.

[장 시작 전 07:30]
모멘텀 스코어링 → 후보 20종목
    ↓
ai-hedge-fund 분석가 4인 투표 (각 종목별)
    ├─ Fundamental: 재무 건전성 큰 문제 없음?
    ├─ Valuation: 단기 과열 구간은 아닌가?
    ├─ Sentiment: 부정 뉴스/공시 없음?
    └─ Technical: 일봉 추세 방향 OK?
    ↓
4명 중 3명 이상 찬성한 종목만 → 최종 화이트리스트 10종목

데이트레이딩이라 펀더멘털 비중은 낮지만, "재무 상태 극히 불량한 종목(관리종목·감사의견 거절)"을 자동 제외하는 필터로 쓴다. 또한 센티멘트 분석은 기존 News Agent가 하던 일을 더 구조화된 포맷으로 대체한다.

선택한 이유:

기존 News Agent가 단일 센티멘트만 내는데, 4관점 합의는 더 견고
LLM 호출이 장 시작 전 1회(종목당)뿐이라 비용 관리 가능 (Claude Haiku 4.5 기준 종목당 입력 ~3K·출력 ~500 토큰 가정 시, 20종목 × 매일이면 월 수천 원대로 추산 — 실측 후 갱신 예정)
ai-hedge-fund 소스에서 분석가 에이전트만 떼와 붙이면 됨 (의존성 가벼움)

4-3. 아키텍처 다이어그램

[기존 설계]
Scheduler → Analyst → Strategy → Orderflow → Risk → Executor
                                   ↑ News (센티멘트)

[개편 후 설계]
Scheduler 
├─ 장 시작 전: ai-hedge-fund 분석가 4인 → 화이트리스트 10종목
└─ 장 중: 
   Analyst → Strategy(VWAP) + Orderflow + Kronos(예측) → Risk → Executor
                                         ↑ News

Kronos는 Strategy 내부의 서브모듈이고, ai-hedge-fund 분석가는 Scheduler의 장 시작 전 루틴에 붙는다. 기존 모듈을 건드리지 않고 추가만으로 통합 가능한 구조다.

5. 후기 (실측 데이터 업데이트 예정)

⚠️ 이 섹션은 2026년 5월 중 모의투자 30일 백테스트 결과로 업데이트될 예정이다.

계획된 측정 지표

지표	베이스라인 (기존)	Kronos 필터 추가	+화이트리스트 압축
일 평균 진입 횟수	TBD	TBD	TBD
승률	TBD	TBD	TBD
평균 이익 / 평균 손실	TBD	TBD	TBD
거래당 기댓값(Expectancy)	TBD	TBD	TBD
Profit Factor	TBD	TBD	TBD
Sortino 비율	TBD	TBD	TBD
최대 낙폭(MDD)	TBD	TBD	TBD
Kronos 추론 레이턴시 P95	—	TBD	TBD
장 시작 전 LLM 비용	—	—	TBD

데이트레이딩 일중 전략엔 연율화 샤프 대신 거래당 기댓값과 Profit Factor를 주 지표로 쓴다. Sortino는 하방 변동성만 보는 보조 지표.

예상 결과 (선언적 가설, 목표 수치)

Kronos 필터 추가: 목표는 진입 횟수 30~50% 감소 + Profit Factor 개선. 승률만 올라도 PF가 같거나 줄면 의미가 없으니 PF가 핵심 지표
화이트리스트 압축: 수익률 변화보다 MDD 축소에 더 기여할 것으로 기대. 부정 뉴스·공시 종목 사전 제외 효과
추론 레이턴시: MLX/CoreML 변환 + Metal 가속 전제 Kronos-small, M1 Mac 기준 P95 200ms 이하 목표. KIS WebSocket tick 주기를 고려하면 충분히 낮은 수준

위 숫자는 사전 벤치 없이 설정한 목표다. 실측과 벌어지는 지점이 보이는 족족 별도 포스트로 정리할 계획이다.

실패 가능성 (사전 기록)

과적합 가능성을 미리 적어둔다. Kronos가 학습한 시장 체제와 현재 한국 증시 체제가 다르면 예측 정확도가 급락할 수 있다. 특히 2026년 1~4월의 변동성 패턴이 학습 데이터와 크게 다르면 오히려 필터를 안 쓰는 게 나을 가능성도 있다. 백테스트에서 최근 3개월을 홀드아웃 기간으로 따로 떼어 테스트할 예정이다.

자주 묻는 질문 (FAQ)

Q. ai-hedge-fund를 실제 돈 굴리는 데 써도 되나요?

저자가 README 최상단에 "FOR EDUCATIONAL AND RESEARCH PURPOSES ONLY. DO NOT USE FOR REAL TRADING OR INVESTMENT"를 명시했다. 페르소나는 근사치일 뿐이고, temperature>0이면 결과가 재현되지 않으며, 최신 재무 데이터가 자동 반영되지 않는다. 연습용·아키텍처 학습용으로 쓰고, 실전 신호는 별도 검증을 거쳐 쓰는 게 원칙이다.

Q. Kronos를 한국 주식에도 쓸 수 있나요?

학습 데이터에 한국거래소(KRX)가 포함돼 있지만, 학습 비중은 공개되지 않았다. 한국 시장 특유의 변동성(상·하한가 제도, 개인투자자 비중 등)에 완벽히 적응하지 못할 가능성이 있다. 자체 데이터로 파인튜닝하는 것을 권장한다. Kronos-small(24.7M) 정도면 RunPod·vast.ai 같은 GPU 클라우드에서 A100 수시간 이내에 해결되며, 일반적으로 수만 원~십수만 원 범위(에포크·하이퍼파라미터에 따라 변동)다. 파인튜닝 시에는 KRX 데이터 최소 1년치에 체제(코로나 전후, 2022 약세장 등) 레이블을 같이 붙여 넣는 게 좋다.

Q. 두 프로젝트 말고 다른 AI 트레이딩 오픈소스는 없나요?

있다. FinGPT(금융 도메인 파인튜닝 LLM), Qlib(마이크로소프트의 퀀트 플랫폼), stockbot-on-groq(Groq + LLM 실시간 시각화) 등. 하지만 2026년 1분기 기준 "페르소나 기반 멀티 에이전트"와 "금융 전용 파운데이션 모델" 이라는 두 축을 가장 선명하게 보여주는 게 ai-hedge-fund와 Kronos다.

Q. Kronos 대신 ChatGPT에 차트 이미지를 넣으면 안 되나요?

가능하지만 비효율적이다. GPT-4o나 Claude Sonnet의 비전 모델은 범용으로 학습됐기 때문에, 캔들차트 해석이 Kronos만큼 정교하지 않다. 또 API 호출 비용이 Kronos 온디바이스 추론 대비 수백 배 비싸다. 수치 데이터가 이미 있다면 전용 모델이 정답이다.

Q. 자동거래 앱을 직접 만드는 건 법적으로 문제없나요?

한국 기준, 자신의 계좌에서 자신의 자금으로 거래하는 개인 알고리즘 작성·실행은 일반적으로 자본시장법상 인가 대상이 아니다. 반면 타인의 자금을 위탁받아 운용하거나 매매 신호를 유료 제공하면 투자자문업·투자일임업 인가가 필요해진다. 이 글의 프로젝트는 전자에 해당한다. 다만 본인 거래라도 미국 주식 워시세일·한국 대주주 요건·해외주식 양도세 같은 세무 이슈는 따로 발생하니 반드시 세무사·법률 전문가에게 본인 상황을 확인하는 게 안전하다.

Q. 이 실험 결과를 언제 업데이트하나요?

모의투자 30일 백테스트가 끝나는 2026년 5월 말~6월 초 업데이트 예정이다. 실거래 전환 기준은 Profit Factor 1.3 이상 + Expectancy 양수 + MDD -10% 이내로 설정했다(일중 전략 기준이라 연율화 샤프는 메인 기준에서 제외). 결과는 이 글 말미에 표로 추가하고, 실패 원인 분석은 별도 포스트로 게재한다.

마무리: "AI 트레이딩"의 실전 설계 원칙

두 프로젝트를 뜯어보면서 정리한 세 가지를 남긴다.

① LLM을 판단 주체로 쓰지 말라

범용 LLM은 "이유를 설명하는 데" 강하고, "수치를 예측하는 데" 약하다. ai-hedge-fund가 교육용에 머무르는 이유도 여기 있다. 판단은 전용 모델(Kronos)이나 결정론 규칙(VWAP·ATR)에 맡기고, LLM은 설명과 합의에 써야 한다.

② 도메인 특화 파운데이션 모델 시대를 준비하라

Kronos는 시작점이다. 곧 옵션 가격용, 뉴스 영향도 측정용, 매크로 이벤트 예측용 파운데이션 모델이 오픈소스로 쏟아진다. "범용 GPT에 프롬프트 엔지니어링"하던 시대는 짧게 지나간다. 전용 모델 × 파인튜닝 × 프롬프트 3단 계층이 표준이 된다.

③ 결정론과 확률론을 분리 배치해라

내 앱 설계의 핵심 원칙이기도 하다. 15:20 강제 청산은 결정론(하드컷), VWAP 진입은 반결정론(규칙+파라미터), Kronos 예측은 확률론(임계치 필터). 세 계층을 섞지 말고 합성해야 시스템이 설명 가능해지고 디버깅도 된다.

오픈소스 하나로 인생이 바뀌진 않는다. 그래도 좋은 오픈소스는 설계 철학을 공짜로 가르친다. ai-hedge-fund는 "LLM을 어떻게 협업시키는가"를, Kronos는 "시계열을 어떻게 언어처럼 다루는가"를 보여준다. 이 두 질문에 자기 답을 가진 개발자만이 2026년 AI 트레이딩 시스템을 제대로 만든다고 본다.

실측 결과는 5월 말 이 글에 표로 추가할 예정이다. 먼저 보고 싶다면 구독 눌러두면 손해 볼 일 없다.

연관 글: 이 시리즈의 1편 — Claude Code 오픈소스 추천 7선과, 이 블로그 테크 카테고리의 AI 에이전트·자동화 글들을 함께 보면 흐름이 이어진다.

태그: AI 트레이딩, Kronos, 금융 파운데이션 모델, 오픈소스, KIS OpenAPI

Company.bites

AI 트레이딩 오픈소스: ai-hedge-fund vs Kronos 설계기