logo
|
Blog
  • 기업 정보
aspn 알아보기
AISAP Analytics Cloud

"ChatGPT한테 물어보면 되지 않나요?" ML 예측이 필요한 진짜 이유

분류·회귀분석·시계열 — SAC 3대 예측 시나리오를 통해 데이터 기반 예측이 왜 경영 현장에서 작동하는지 설명합니다.
BAC's avatar
BAC
Jun 29, 2026
"ChatGPT한테 물어보면 되지 않나요?" ML 예측이 필요한 진짜 이유
Contents
1. 담당자가 바뀌면 예측도 바뀐다2. SAC 예측 시나리오란 무엇인가3. 시나리오 ① 분류 — "이 고객, 떠날까?"4. 시나리오 ② 회귀분석 — "다음 달 원가는 얼마?"5. 시나리오 ③ 시계열 예측 — "내년 1월 판매량은?"6. 세 가지 중 무엇을 써야 하나7. "그냥 ChatGPT 쓰면 안 되나요?"8. 마무리 — 시작은 단 하나의 질문

매 분기 예산 회의가 끝날 때마다 이런 질문이 나옵니다. "다음 분기 매출은 얼마가 될까요?" "이 고객이 이탈할 것 같은데, 어떻게 알 수 있죠?" 담당자가 엑셀로 추세선을 그리고, 경험 많은 팀장이 '감으로' 조정합니다.

1. 담당자가 바뀌면 예측도 바뀐다

ASPN Korea의 영업 담당자 김 과장은 매월 다음 달 판매량을 보고해야 합니다. 그의 예측 방식은 단순합니다. 지난 3개월 평균에 자신의 '시장 감각'을 더해 숫자를 냅니다. 정확도는 나쁘지 않습니다. 하지만 그가 이직하던 날, 팀의 예측 체계도 함께 사라졌습니다.

이것이 경험 의존 예측의 핵심 문제입니다. 예측이 시스템이 아닌 사람에게 저장됩니다. 그리고 사람은 이직하고, 은퇴하고, 때로는 아파서 자리를 비웁니다.

데이터 기반 ML 예측은 이 문제를 구조적으로 해결합니다. 모델은 데이터에서 패턴을 학습하고, 동일한 모델과 동일한 입력에서 동일한 결과를 냅니다. 담당자가 바뀌어도 예측의 논리는 시스템 안에 남아있습니다.

SAP Analytics Cloud(SAC)의 Smart Predict는 바로 이 목적을 위해 설계된 기능입니다. 그리고 핵심은 단 세 가지 시나리오로 구성되어 있습니다.

2. SAC 예측 시나리오란 무엇인가

SAC 예측 시나리오는 SAP Analytics Cloud 안에 내장된 머신러닝 기반 예측 기능입니다. 별도의 데이터 과학 도구 없이, SAC 안에서 데이터를 업로드하고 예측 모델을 만들어 결과를 Planning 시스템에 바로 반영할 수 있습니다.

예측 시나리오를 이해하는 가장 빠른 방법은 질문입니다. 예측하고 싶은 것이 무엇이냐에 따라 세 가지 시나리오 중 하나를 선택하면 됩니다.

💡

시나리오 선택 원칙 — 한 문장

목표변수가 범주면 분류, 수치면 회귀분석, 시간 순서가 있는 수치면 시계열 예측입니다.

말은 간단하지만, 실제로 이 세 가지가 어떻게 다른지, 어떤 현장에서 어떻게 쓰이는지는 직접 사례를 보는 것이 빠릅니다. 하나씩 살펴보겠습니다.

3. 시나리오 ① 분류 — "이 고객, 떠날까?"

"이것은 A인가, B인가?"

분류 모델은 입력 데이터를 받아 미리 정해진 범주 중 하나로 판별합니다. 결과는 숫자가 아닙니다. "이탈 / 유지", "불량 / 정상", "승인 / 거절" 같은 카테고리입니다.

직관적 비유

이메일 스팸 필터를 생각해보세요. 제목·발신자·본문 패턴을 분석해서 내부적으로 "스팸일 확률 87%"를 계산한 뒤, 임계값을 기준으로 최종 출력을 스팸 / 정상둘 중 하나로 내보냅니다. 확률을 계산하지만 사용자에게 보여주는 것은 범주입니다.

현장 적용 사례

통신 · 구독 서비스

고객 이탈 예측

ASPN Korea B2C 사업부는 최근 3개 분기 해지율이 상승했습니다. 사용 패턴·민원 이력·계약 잔여 기간을 분석해 이탈 가능성이 높은 고객을 한 달 전에 식별합니다.

입력: 사용량, 민원횟수, 잔여기간

출력: 이탈 / 유지

제조 · 품질

불량 판별

ASPN Manufacturing은 공정 파라미터(온도·압력·속도)와 원자재 품질 데이터를 기반으로 배치별 불량 가능성을 출하 전에 예측합니다.

입력: 온도, 압력, 원자재 등급

출력: 정상 / 불량

금융

신용 위험 분류

소득·부채비율·연체 이력을 기반으로 대출 신청자의 상환 가능성을 판별합니다. 확률 점수로 고위험 신청자를 우선 심사합니다.

입력: 소득, 부채비율, 연체이력

출력: 승인 / 거절

HR · 인사

이직 리스크 분류

근속연수·성과 등급·급여 수준을 기반으로 이직 가능성이 높은 직원을 조기에 식별합니다. 리텐션 인터뷰 대상자 선정에 활용합니다.

입력: 근속, 성과, 급여

출력: 고위험 / 저위험

💡

실무 주의사항 — Data Leakage

분류 모델을 만들 때 가장 흔한 실수는 예측 시점에 존재하지 않는 데이터를 모델에 포함하는 것입니다. 예를 들어 "해지 처리 완료 일자" 같은 컬럼은 이탈 이후에야 기록되는 값입니다. 이것을 포함하면 모델 정확도가 비정상적으로 높게(AUC 1.0에 가깝게) 나옵니다. "너무 정확하다"고 느껴진다면 이 가능성을 먼저 의심해야 합니다.

"범주로 답할 수 있는 질문이라면 — 분류 시나리오"

4. 시나리오 ② 회귀분석 — "다음 달 원가는 얼마?"

"얼마가 될 것인가?"

회귀분석 모델은 여러 독립변수(원인)가 하나의 연속적인 수치(결과)에 얼마나 영향을 미치는지 파악합니다. 분류와 다른 점은 출력이 범주가 아닌 구체적인 숫자라는 것입니다.

직관적 비유

부동산 앱의 "예상 매매가"를 생각해보세요. 면적·층수·역까지의 거리를 입력하면 "예상 매매가 6.2억"이라는 숫자가 나옵니다. "비싸다 / 싸다"가 아닌 정확한 금액을 예측합니다. 회귀분석이 바로 이 방식입니다.

현장 적용 사례

제조 · 원가

단위 제조원가 예측

ASPN Manufacturing CFO는 환율·원자재 단가·가동률이 단위 원가에 얼마나 영향을 주는지 수치로 파악하고, 환율 1,200원 / 1,350원 / 1,500원 시나리오별 원가를 예산 계획에 활용합니다.

입력: 원자재가, 환율, 가동률

출력: 단위 원가 (원/개)

마케팅 · 영업

광고비 대비 매출 예측

TV·디지털·검색 채널별 광고비 투입이 매출에 얼마나 기여하는지 정량화합니다. 마케팅 예산 배분 최적화에 활용합니다.

입력: 채널별 광고비

출력: 예상 매출 (원)

회귀분석이 알려주는 것

단순히 "원가가 얼마일 것이다"를 예측하는 것을 넘어, 어떤 변수가 원가에 얼마나 영향을 미쳤는지를 보여줍니다. 예를 들어 가상의 분석 결과 가 이렇게 나왔다고 가정해보겠습니다.

이 결과가 CFO에게 전달하는 메시지는 명확합니다. "환율 헷지보다 가동률 관리가 원가 통제의 핵심 레버"라는 사실을 수치로 증명한 것입니다.

💡

실무 주의사항 — 다중공선성

같은 정보를 두 가지 단위로 표현한 컬럼을 동시에 넣으면 모델이 혼란스러워집니다. 예를 들어 '원자재_단가_KRW'와 '원자재_단가_USD'를 둘 다 넣으면 환율을 곱한 값이라 사실상 동일한 정보입니다. 이런 경우 계수가 불안정해져 해석이 어려워집니다. 둘 중 하나만 선택하세요.

"연속적인 숫자가 답이고, 어떤 변수가 영향을 주는지도 알고 싶다면 — 회귀분석"

5. 시나리오 ③ 시계열 예측 — "내년 1월 판매량은?"

"앞으로 어떻게 변하는가?"

시계열 예측 모델은 회귀분석과 마찬가지로 연속적인 수치를 예측합니다. 결정적인 차이는 하나입니다. 시간 순서 자체가 데이터의 본질이라는 점입니다. 시간 순서를 고려하지 않으면 패턴을 학습할 수 없습니다.

직관적 비유

날씨 예보를 생각해보세요. 기상청은 과거 수십 년의 기온 패턴을 학습해 이번 주 금요일의 기온을 예측합니다. 중요한 것은 '어떤 변수들이 기온을 결정하는가'가 아니라 '시간에 따른 패턴이 어떻게 반복되는가'입니다. 이것이 회귀분석과의 차이입니다.

시계열 데이터의 세 가지 요소

시계열 모델은 데이터를 세 가지 요소로 분해해서 학습합니다.

추세 (Trend)

↗

장기적 방향성
우상향·우하향·수평

계절성 (Seasonality)

∿

반복되는 주기
월·분기·요일 패턴

불규칙 (Residual)

⌇

예측 불가 잡음
돌발 이벤트·오류

모델은 추세와 계절성을 학습하고, 불규칙 요소는 신뢰구간(예측의 상한·하한 범위)으로 정직하게 표현합니다. 신뢰구간이 넓어질수록 불확실성이 크다는 뜻이며, 이것은 모델의 결함이 아니라 불확실성의 솔직한 표현입니다.

현장 적용 사례

유통 · SCM

월별 판매량 예측

ASPN Korea 유통 부문은 성수기(4분기)와 비수기(1분기) 편차가 커서 재고 과잉과 부족이 반복됐습니다. 36개월 판매 이력으로 계절성을 학습해 6개월 선행 재고 계획을 수립합니다.

입력: 월별 판매량 이력

출력: 향후 6개월 예측

에너지 · 유틸리티

전력 수요 예측

시간대·요일·계절별 전력 소비 패턴을 학습해 발전량 계획 및 피크 타임 대응 전략을 수립합니다. 예측 오차 1%p 개선이 수십억 원의 비용 차이로 이어집니다.

입력: 시간대별 소비량

출력: 시간대별 수요 예측

💡

실무 주의사항 — 이상값의 영향

특정 월의 판매량이 전후 대비 10배라면, 그것이 실제 영업 결과인지 전산 입력 오류인지 먼저 확인해야 합니다. 이상값을 그대로 두고 모델을 학습시키면 "이런 급등이 패턴으로 반복된다"고 모델이 잘못 학습합니다. ASPN Korea 데이터에서 실제로 이런 오류가 있었고, 이상값 처리 전후의 예측 오차(MAPE)가 7.0%에서 3.6%로 개선됐습니다.

"시간 순서가 데이터의 본질이고, 미래 n개 기간을 연속으로 예측하고 싶다면 — 시계열"

6. 세 가지 중 무엇을 써야 하나

셋 중에 무엇을 선택할지 혼란스럽다면, 아래 세 가지 질문에 순서대로 답하면 됩니다.

시나리오 자가진단

  • 예측 결과가 "맞다/틀리다" 같은 범주인가?

    이탈/유지, 불량/정상, 승인/거절처럼 정해진 카테고리 중 하나라면 → 분류 (Classification)

  • 예측 결과가 숫자이고, 시간 패턴과 무관한가?

    원가, 매출액, 위험 점수처럼 여러 독립변수의 영향을 받는 수치라면 → 회귀분석 (Regression)

  • 예측 결과가 숫자이고, 시간 순서가 핵심인가?

    월별 판매량, 주간 전력 수요, 환율 추이처럼 시간 흐름의 패턴이 핵심이라면 → 시계열 예측 (Time Series)

비교 항목

분류

회귀분석

시계열

핵심 질문

어느 범주인가?

얼마인가?

어떻게 변하는가?

출력 유형

카테고리 + 확률

예측 수치 + 계수

미래 n기간 + 신뢰구간

Date 컬럼 필요

불필요

불필요

필수

대표 정확도 지표

AUC, Accuracy

R², MAPE

MAPE, 신뢰구간 폭

대표 사례

이탈 예측, 불량 판별

원가·매출 예측

수요·가격 추이 예측

7. "그냥 ChatGPT 쓰면 안 되나요?"

여기까지 읽으셨다면 아마 이 질문이 떠올랐을 겁니다. 솔직하게 답하겠습니다.

어떤 부분에서는 맞습니다. ChatGPT Enterprise나 Microsoft Copilot 같은 생성형AI(GenAI)는 탐색적 분석에서 압도적으로 편리합니다. 자연어로 "이 데이터에서 흥미로운 패턴 찾아줘"라고 물으면 됩니다. SAC처럼 변수 설계나 시나리오 설정을 배울 필요가 없습니다. 진입 장벽이 낮고, 자유도가 높습니다.

하지만 경영 현장에서 정기적으로 반복되는 예측에 GenAI를 쓰려 할 때, 세 가지 문제가 생깁니다.

문제 1 — 같은 질문, 다른 답

GenAI는 동일한 입력에도 매번 다른 결과를 낼 수 있습니다. 이달에 "매출 예측해줘"라고 물어본 것과 다음 달에 물어보는 것의 결과가 다를 수 있다는 뜻입니다. 경영 보고에 쓸 숫자는 동일한 입력에 동일한 결과가 나와야 합니다. SAC 예측 시나리오는 학습된 모델을 저장하고 재실행 비용도 없습니다.

문제 2 — "왜 이 숫자인가"를 설명할 수 없다

CFO가 "이 원가 예측의 근거가 무엇이냐"고 물었을 때, "AI가 그렇게 말했습니다"는 답이 될 수 없습니다. SAC 예측 시나리오는 Influence Factor, 계수값, 정확도 지표(R², AUC, MAPE)가 시스템 안에 기록되고 추적됩니다. 금융·제조·공공처럼 감사 대응이 필요한 환경에서는 이 차이가 결정적입니다.

문제 3 — 반복 토큰 비용

매월 수백 행의 데이터를 컨텍스트에 올리고, 전처리 지시·모델 선택·결과 해석·재질문을 반복하면 토큰 비용 또는 사용량 기반 비용이 누적될 수 있으며, 라이선스 정책에 따라 총비용(TCO)을 함께 고려해야 합니다.

💡

그렇다면 GenAI와 SAC ML은 무슨 관계인가?

경쟁 관계가 아닙니다. GenAI는 새로운 질문을 빠르게 탐색하는 도구이고, SAC ML은 검증된 답을 반복적으로 신뢰하게 만드는 도구입니다. 그리고 한 가지 더 — SAC ML을 운영하면서 데이터 품질을 정제하고 파이프라인을 구축하는 경험이, 귀사의 GenAI 본격 도입을 위한 가장 확실한 준비 작업이 됩니다.

SAC ML 기반의 데이터 품질과 예측 체계가 GenAI 활용의 기반이 됩니다.

8. 마무리 — 시작은 단 하나의 질문

예측은 더 이상 "감"의 영역이 아닙니다. 데이터가 있고 SAC가 있다면, 분류·회귀분석·시계열 중 하나가 여러분의 질문에 답할 수 있습니다.

시작은 복잡하지 않습니다. 단 하나의 질문에서 시작하세요.

💡

"내가 예측하고 싶은 것이 범주인가, 숫자인가?"

이 질문에 답할 수 있다면, 어떤 시나리오를 선택해야 하는지 이미 절반은 결정된 것입니다.

ASPN은 SAC 예측 시나리오 도입부터 모델 설계, 결과 해석, SAP Planning 연계까지 전 과정을 지원합니다.

Share article
Contents
1. 담당자가 바뀌면 예측도 바뀐다2. SAC 예측 시나리오란 무엇인가3. 시나리오 ① 분류 — "이 고객, 떠날까?"4. 시나리오 ② 회귀분석 — "다음 달 원가는 얼마?"5. 시나리오 ③ 시계열 예측 — "내년 1월 판매량은?"6. 세 가지 중 무엇을 써야 하나7. "그냥 ChatGPT 쓰면 안 되나요?"8. 마무리 — 시작은 단 하나의 질문

SAP 컨설팅 & ITO 서비스

RSS·Powered by Inblog