Korean PIPA (Personal Information Protection Act) consulting LoRA adapter for Qwen3-8B, trained on 9,009 curated legal Q&A samples with 5-stage validation pipeline.
한국 개인정보 보호법(PIPA) 실무 Q&A에 최적화된 Qwen3-8B 기반 LoRA 파인튜닝 모델입니다.
답변은 [판단] → [법적 근거] → [실무 조치] → [추가확인질문] 4단 구조를 따르며,
[법적 근거] 내부에 원칙 → 조건(트리거) → 예외 3단 구조를 사용합니다.
Best config:temperature=0.5, repetition_penalty=1.0Score:14.38 / 15 (5축), Gold 144/150 (96.0%)
Evaluation: 2026-02-27 · 150-question gold set · 5-axis scoring v2.1
주요 특징
Qwen3-8B 기반 LoRA SFT (r=64, α=128, 7개 target modules)
개인정보보호법 특화: 9,009건 한국어 법률 Q&A 데이터로 학습 (품질 기반 리밸런싱)
5단 자동 검증 파이프라인: 구조/조문/수치/금지패턴/도메인격리 자동 검수
원칙-조건-예외 3단 구조: 법적 판단의 조건부 뉘앙스를 체계적으로 전달
상용 API 대비 압도적 우위: GPT-4o(7.99) 대비 +6.39점 (task-specific)
성능
5축 15점 평가 (150건 골드셋)
순위
모델
유형
총점/15
구조
법조항
내부
실무
표현
Gold
Silver
Fail
※
Claude Opus 4.6 ¹
참조
15.00
3.00
3.00
3.00
3.00
3.00
150
0
0
1
v4-rebalanced
SFT
14.38
2.96
2.66
2.95
2.93
2.87
144
2
4
2
v4
SFT
13.74
3.00
2.17
2.99
3.00
2.59
123
26
0
3
v3.1
SFT
13.21
2.99
2.19
2.95
2.98
2.10
97
52
1
4
v4-full
SFT
12.65
3.00
2.23
3.00
3.00
1.42
67
82
1
5
v3
SFT
12.23
3.00
2.06
2.96
2.88
1.33
39
98
3
6
Qwen3-8B Base
Base
10.01
2.92
2.46
0.32
2.11
2.19
14
1
60
7
GPT-4o ²
API
7.99
3.00
2.81
0.00
1.79
1.31
0
0
138
8
Solar Pro ²
API
7.99
2.91
2.15
0.00
1.89
1.04
0
0
142
9
Gemini Pro ²
API
7.71
1.99
2.72
0.00
2.00
1.00
0
0
145
¹ Claude Opus 4.6: 채점 기준의 상한(reference oracle). 비교 대상이 아닌 참조 기준.
² 상용 API 모델: 본 평가는 한국 개인정보보호법 도메인 전문성과 특정 출력 형식을 동시에 요구하는 task-specific 벤치마크입니다. 내부구조 0점은 원칙/조건/예외 패턴이 프롬프트만으로 출력되지 않기 때문이며, 해당 모델들의 범용 능력과 직접 비교할 수 없습니다.
채점 기준 (5축 v2.1)
축
0점
1점
2점
3점
구조
섹션 없음
1-2섹션
3섹션 또는 금지섹션 포함
4섹션 완전 + 금지섹션 없음
법조항
없음
제N조 존재
풀인용(OO법 제N조)
풀인용 + MIN_CORE 정합 + 시행령
내부구조
없음
1-2개
원칙/조건/예외 3개
3개 + 예외 실질 내용
실무
없음
액션 1-2개
액션 3개+
즉시/단기/재발방지 3단계 + 액션 3개+
표현
금지패턴+CJK
금지패턴 없음
조건부 secondary
조건부 primary(다만) + 무오염
Gold: ≥12.5/15 AND 전 게이트 통과 · Silver: ≥11.5 · Bronze: ≥10.0
내부 개발 과정에서는 3축 9점(구조/정확/실무) 스케일도 병행 운용하며, 두 스케일 간 직접 환산 관계는 없습니다.
v4-rebalanced 도메인별 성능
도메인
문항
총점/15
구조
법조항
내부
실무
표현
Gold
시행령
다만
국외이전
20
14.75
3.00
2.75
3.00
3.00
3.00
20/20
75%
100%
위탁_처리
25
14.48
3.00
2.60
3.00
3.00
2.88
24/25
68%
100%
유출_대응
30
14.43
3.00
2.63
3.00
3.00
2.80
30/30
63%
90%
제3자_제공
25
14.40
3.00
2.48
3.00
3.00
2.92
24/25
48%
96%
기타 ³
20
14.30
2.90
2.85
2.90
2.85
2.80
18/20
85%
90%
동의_수집
30
14.03
2.87
2.70
2.83
2.77
2.87
28/30
70%
93%
³ 기타: 파기, 안전조치, CCTV, 정보주체 권리, ISMS-P, 거버넌스, 벌칙 등 포함
품질 메트릭 (모델 출력 기준)
모델
유형
평균길이
시행령%
다만%
내부구조%
3단계%
금지패턴
Claude Opus 4.6
참조
600
100%
100%
100%
100%
0건
v4-rebalanced
SFT
721
67%
95%
98%
98%
1건
v4
SFT
615
17%
78%
99%
100%
1건
v3.1
SFT
505
19%
49%
98%
99%
0건
v4-full
SFT
494
23%
13%
100%
100%
1건
v3
SFT
517
9%
9%
99%
100%
1건
Qwen3-8B Base
Base
1255
77%
70%
11%
95%
20건
GPT-4o
API
760
45%
70%
0%
0%
29건
Solar Pro
API
1409
30%
29%
0%
0%
53건
Gemini Pro
API
1522
35%
25%
0%
0%
42건
시행령%: 관련 시행령 동시 인용 비율, 다만%: 조건부 표현("다만,") 포함 비율, 내부구조%: 원칙/조건/예외 3단 포함 비율, 3단계%: 즉시/단기/재발방지 구분 비율
사용법
설치
pip install transformers torch accelerate
# LoRA adapter 직접 로드 시:
pip install peft
추론 (Merged 모델)
fromtransformersimportAutoModelForCausalLM,AutoTokenizermodel_name="cywellai/privacy-counsel-ko-8b"tokenizer=AutoTokenizer.from_pretrained(model_name,trust_remote_code=True)model=AutoModelForCausalLM.from_pretrained(model_name,torch_dtype="bfloat16",device_map="auto",trust_remote_code=True,)SYSTEM_PROMPT="""당신은 대한민국 개인정보보호법 전문 상담사입니다.
질문에 대해 [판단], [법적 근거], [실무 조치], [추가확인질문] 형식으로 구조화된 답변을 제공합니다.
모든 답변은 관련 법조항을 정확히 인용하고, 조건부 표현을 사용하여 법적 판단의 뉘앙스를 전달합니다."""messages=[{"role":"system","content":SYSTEM_PROMPT},{"role":"user","content":"소규모 온라인 쇼핑몰에서 고객 이름과 전화번호를 수집하려 합니다. 어떤 절차가 필요한가요?"},]text=tokenizer.apply_chat_template(messages,tokenize=False,add_generation_prompt=True)inputs=tokenizer(text,return_tensors="pt").to(model.device)outputs=model.generate(**inputs,max_new_tokens=1500,temperature=0.5,top_p=0.9,repetition_penalty=1.0,do_sample=True,)response=tokenizer.decode(outputs[0][inputs.input_ids.shape[1]:],skip_special_tokens=True)print(response)
추론 (LoRA 어댑터)
fromtransformersimportAutoModelForCausalLM,AutoTokenizerfrompeftimportPeftModelbase_model_name="Qwen/Qwen3-8B"adapter_name="cywellai/privacy-counsel-ko-8b-lora"tokenizer=AutoTokenizer.from_pretrained(base_model_name,trust_remote_code=True)base_model=AutoModelForCausalLM.from_pretrained(base_model_name,torch_dtype="bfloat16",device_map="auto",trust_remote_code=True,)model=PeftModel.from_pretrained(base_model,adapter_name)# 이후 동일한 방식으로 추론
vLLM 추론 (권장)
fromvllmimportLLM,SamplingParamsllm=LLM(model="cywellai/privacy-counsel-ko-8b",trust_remote_code=True,max_model_len=2048,gpu_memory_utilization=0.5,)sampling=SamplingParams(temperature=0.5,repetition_penalty=1.0,max_tokens=1500)# tokenizer.apply_chat_template()으로 프롬프트 구성 후outputs=llm.generate([prompt],sampling)print(outputs[0].outputs[0].text)
추론 파라미터 가이드
파라미터
권장 값
비고
temperature
0.5
최적 균형 (0.3: 보수적, 0.7+: 정확도 하락)
repetition_penalty
1.0
1.15는 정확도 순손실
top_p
0.9
표준 설정
max_new_tokens
1500
평균 응답 ~720자
출력 형식
아래 시스템 프롬프트와 함께 사용할 때 4단 구조가 안정적으로 출력됩니다.
시스템 프롬프트 없이도 4섹션이 출력되는 경우가 있으나, 최적 결과를 위해 시스템 프롬프트 사용을 권장합니다.
[판단]
개인정보 수집 시 정보주체에게 고지해야 하는 필수 항목은 수집 목적, 수집 항목,
보유 및 이용 기간, 동의 거부권 및 거부 시 불이익 등을 포함해야 합니다.
[법적 근거]
• 원칙: 개인정보 보호법 제15조(개인정보의 수집·이용)에 따라 개인정보를
수집하거나 이용할 때 정보주체에게 고지해야 합니다.
• 조건(트리거): 수집 목적, 수집 항목, 보유 및 이용 기간, 동의 거부권 및
거부 시 불이익 등의 내용을 명확히 고지해야 합니다.
(개인정보 보호법 제15조, 시행령 제17조)
• 예외/주의: 다만, 법률에 특별한 규정이 있는 경우나 정보주체의 권리·이익을
침해하지 않는 범위에서 고지를 생략할 수 있습니다.
[실무 조치]
• 즉시: 수집 목적, 항목, 보유기간, 동의 거부권 등의 내용을 문서화하여 준비
• 단기: 정보주체에게 해당 내용을 명확히 고지하고 동의를 받음
• 재발방지: 개인정보 수집 및 이용 절차를 정기적으로 검토하고 필요 시 개선
[추가확인질문]
• 수집하려는 개인정보의 종류와 목적은 무엇인가요?
• 수집한 개인정보의 보유 및 이용 기간은 어떻게 설정되어 있나요?
• 동의 거부 시 정보주체에게 발생할 수 있는 불이익은 무엇인가요?
학습 상세
데이터 리밸런싱 전략
v4-full 학습 데이터(14,088건)에서 품질 기반 필터링과 72B 교사 모델 합성을 거쳐 9,009건으로 리밸런싱했습니다.
5축 법조항 점수 2.66/3 — 최대 병목 축. MIN_CORE 정합 + 시행령 동시 인용이 부족한 경우 존재
모델 출력의 시행령 동시 인용률 67% — 나머지 33%는 본법만 인용
모델 출력의 조건부 표현("다만,") 포함률 95% — 잔여 5%에서 단정적 표현 발생 가능
도메인별 편차: 제3자_제공(시행령 48%)이 가장 낮고, 기타(85%)가 가장 높음
입력 처리:
비표준 약칭(예: "개보법") 사용 시 표준 용어로 정규화 필요
학습 데이터 기준 시점 이후 법령 개정 사항은 미반영
개선 로드맵:
시행령 동시 인용률 67% → 85%+ (P0)
법조항 점수 2.66 → 2.85+ (P1)
기타 도메인(파기/ISMS-P 등) 세분화 학습 (P2)
하드웨어
학습: NVIDIA H200 143GB × 1, ~70분 (4,240초)
추론 (최소): GPU VRAM 16GB 이상 (BF16 기준)
추론 (권장): GPU VRAM 24GB 이상
평가 조건
항목
값
골드셋
150문항 (유출30, 동의30, 위탁25, 제3자25, 국외20, 기타20)
난이도 분포
기본 54, 예외 46, 경계 50
내부 모델 생성 설정
temperature=0.5, repetition_penalty=1.0
채점 모델
Claude Opus 4.6 (5축 v2.1 rubric)
게이트 체크
4섹션, 법조항존재, 금지패턴없음, CJK없음, 200자이상
Gold 기준
총점 ≥12.5/15 AND 전 게이트 통과
Silver 기준
총점 ≥11.5/15
Bronze 기준
총점 ≥10.0/15
Disclaimer
본 모델은 법률 자문을 대체하지 않습니다.
이 모델의 출력은 개인정보보호 실무 참고용으로만 사용해야 하며, 법적 구속력이 있는 판단이나 자문을 구성하지 않습니다. 고위험 의사결정(유출 통지·신고, 국외이전 계약, 과징금 대응 등)은 반드시 법률 전문가의 검토를 거쳐야 합니다.
개인정보 보호법 및 관련 법령은 개정될 수 있으며, 본 모델의 학습 데이터가 최신 법령을 완전히 반영하지 못할 수 있습니다.
Safety & Privacy
PII 입력 최소화: 실명·연락처·주민번호 등은 입력하지 마세요
사례 데이터 가명/마스킹: 로그·공유·재학습 시 동일 원칙 적용
출력 검증 권장: 고위험 의사결정은 내부 체크리스트로 재검토
Changelog
날짜
내용
2026-02-08
v3 공개 (13,631건, 12.23/15)
2026-02-10
v3.1 공개 (13.21/15, Gold 65%)
2026-02-23
v4 / v4-full 공개
2026-02-27
v4-rebalanced 공개 (14.38/15, Gold 96%)
2026-03-01
Model Card v2: 실제 학습 설정 반영, 5축 9개 모델 비교 통합
Citation
@misc{privacy-counsel-ko-8b-v4,title={privacy-counsel-ko-8b (v4-rebalanced):
A Fine-tuned Qwen3-8B for Korean PIPA Consulting},author={CywellAI},year={2026},note={LoRA SFT on Qwen3-8B for Korean Personal Information Protection Act Q\&A.
5-axis 15-point evaluation: 14.38/15, Gold 96\% on 150-question gold set.
Outperforms GPT-4o, Solar Pro, Gemini Pro on task-specific benchmark.},url={https://huggingface.co/cywellai/privacy-counsel-ko-8b}}