[데이터 문해력] 데이터 마이닝의 세계로의 여정 [Data Literacy] A Journey into the World of Data Mining
1. 데이터 마이닝이란?
- 데이터 마이닝은 대규모 데이터 세트에서 통계적 규칙과 패턴을 자동적으로 찾아내는 과정입니다. 이는 KDD(데이터베이스 내 지식 발견)로도 알려져 있습니다.
2. 데이터 마이닝의 기본 개념
- 데이터 마이닝은 데이터의 '산'에서 유용하고 가치 있는 정보를 '채굴하는' 과정으로 비유할 수 있습니다.
3. 데이터 마이닝의 역사
- 데이터 분석은 오래전부터 있었으며, 빅데이터 이전에는 주로 '스몰 데이터' 분석이 이루어졌습니다. 스몰 데이터는 주로 가설 설정과 검증에 초점을 맞추었습니다.
4. 데이터 마이닝과 스몰 데이터의 차이점
- 스몰 데이터는 표본 추출과 분석을 통해 명확한 결과를 도출하는 데 한계가 있었습니다. 반면, 데이터 마이닝은 대용량 데이터를 신속하고 광범위하게 분석합니다.
5. 빅데이터 영역에서의 데이터 마이닝
- 빅데이터에서의 데이터 마이닝은 분류, 군집화, 연관성, 연속성, 예측 등 다양한 분야에 적용됩니다. 이는 비정형 데이터를 포함하는 광범위한 데이터베이스 영역의 확장 덕분입니다.
6. 데이터 마이닝의 실제 적용 예
- 웹 로그 분석을 통해 방문자 수 감소의 원인을 파악하는 예를 들 수 있습니다. 텍스트 마이닝과 시장분석을 결합하여 소비자 성향과 브랜드 인식을 분석하는 것입니다.
1. The History of Data Mining
- Data analysis has been around for a long time, with 'small data' analysis predominating before the advent of big data. Small data focused primarily on hypothesis setting and testing.
2. Differences Between Data Mining and Small Data
- Small data had limitations in deriving clear results through sample extraction and analysis. In contrast, data mining involves the rapid and extensive analysis of large volumes of data.
3. Data Mining in the Realm of Big Data
- In big data, data mining applies to various fields including classification, clustering, association, sequencing, and forecasting. This is thanks to the expansion of database areas that include unstructured data.
4. Practical Applications of Data Mining
- An example can be analyzing the cause of a decrease in website visitor numbers through web log analysis. This involves combining text mining and market analysis to understand consumer trends and brand perception.