최적화 2

[DB16] Query Processing, Query Optimization

* 12.18 업데이트해당 게시물은 한양대학교 컴퓨터소프트웨어학부 김상욱 교수님 데이터베이스시스템 온라인 강의를 듣고 정리한 자료입니다.오류가 있다면 언제든 알려주세요! ● 해당 강의의 목표1. Algorithms for Query Processing2. Query Optimization query는 처리할 수 있는 방법이 굉장히 많다. 이를 execution plan이라고 한다. 어떠한 방법으로 처리할 것인가 결정하는 과정을 query optimization이라고 한다. ◆ Query optimizaiton◆ 주어진 query를 처리하기 위한 적절한 execution plan을 고르는 과정이다.query는 다양한 방법으로 처리될 수 있다. SQL이 declarative language이기 때문에 어떠한..

[기계학습] Linear Regression_과적합 해결하기

지난 포스팅에서는 회귀분석에 대한 개념과 선형 회귀의 최적 model parameter를 계산하는 방법에 대해 공부했다.$\hat{\beta} = (X^TX)^{-1}X^Ty$ 이 식은 꼭 외우도록 하자! 하지만 학습할 때 주의해야 될 사항이 있다. 바로 과적합이다.과적합은 model이 training data를 너무 신경쓰다보니 정작 test data에서는 예측 성능이 떨어지는 문제를 말한다. training data에 대해서는 완벽하게, 거의 error가 0일 정도로 학습되는데 test data에 대해서는 예측을 잘 하지 못한다.그림으로 이해해 보자. 왼쪽 그림은 파란색과 빨간색을 분류하는 문제이다. 분류를 할 때 data가 하나씩 misclassification될 때마다 error값이 증가할 것이다..