데이터 마이닝(Data Minnig)
본문 바로가기
CS/Database

데이터 마이닝(Data Minnig)

by IYK2h 2022. 6. 21.
728x90

데이터 마이닝(Data Minnig)

대규모로 저장된 데이터 안에서 체계적이고 자동적으로 통계적 규칙이나 패턴을 찾아내는 기술

데이터 마이닝은 대규모 데이터에서 의미 있는 패턴을 파악하거나 예측하여 의사결정에 활용하는 기법

데이터 마이닝은 데이터의 숨겨진 정보를 찾아내어 이를 기반으로 서비스와 제품에 도입하는 과정

통계분석은 가설이나 가정에 따른 분석, 검증을 하지만 데이터 마이닝은 수리 알고리즘을 활용하여 대규모 데이터에서 의미 있는 정보를 찾아낸다.

데이터 마이닝 절차

목적 설정 -> 데이터 준비 -> 가공 -> 마이닝 기법 적용 -> 정보 검증

데이터 마이닝 주요 기법

  • 덱스트 마이닝
    • 대량의 텍스트 데이터로부터 패턴 또는 관계를 추출하여 의미 있는 정보를 찾아내는 기법
    • 304745비정형/반정형 데이터에 대하여 자연어/문서 처리 기술을 적용하여 의미 있는 정보를 추출
  • 웹 마이닝
    • 웹으로부터 얻어지는 방대한 양의 정보로부터 유용한 정보를 찾아내기 위하여 분석하는 기법
    • 웹 자원으로부터 의미 있는 패턴, 프로 파일, 추세 등을 발견하기 위하여 데이터 마이닝 기술을 응용한 것
  • 등등
주요 기법 설명
분류 규칙 (Classification) 과거 데이터로부터 특성을 찾아내어 분류모형을 만들어 이를 토대로 새로운 레코드의 결과 값을 예측하는 기법
마케팅, 고객 신용평가 모형에 활용
연관 규칙 (Association) 데이터 안에 존재하는 항목들 간의 종속관계를 찾아내는 기법
제품이나 서비스의 교차판매, 매장 진열, 사기 적발 등 다양한 분야에서 활용
연속 규칙 (Sequence) 연관 규칙에 시간 관련 정보가 포함된 형태의 기법
개인별 트랜잭션 이력 데이터를 시계열적으로 분석하여 트랜잭션의 향후 발생 가능성 예측
데이터 군집화 (Clustering) 대상 레코드들을 유사한 특성을 지닌 몇 개의 소그룹으로 분할하는 작업으로 작업의 특성이 분류규칙과 유사
정보가 없는 상태에서 데이터를 분류하는 기법
분석대상에 결괏값이 없으며, 판촉활동이나 이벤트 대상을 선정하는데 활용
728x90

'CS > Database' 카테고리의 다른 글

NoSQL (Not Only SQL)  (0) 2022.06.17
데이터 모델의 구성요소  (0) 2022.06.14
비 정규화 / 반 정규화(De-Normalization)  (0) 2022.06.10
Oracle 권한 및 역할  (0) 2022.01.21
트랜잭션  (0) 2022.01.14

댓글