본문 바로가기

전체 글

(12)
주성분 분석 (PCA를 이용하여) 주성분 분석은 S&P 500 지수를 예로 들었을 때 500개를 모두 검사하는 게 아니라 차원 축소(PCA) 과정을 통하여 뽑혀진 주성분을 가지고 (ex:10) 그 것을 지표로 삼아서 전체를 판단하는 것이다. 중요한 문제가 있다. 여기서 A'라는 주성분으로 이루어진 선을 분석해야 하는데 a가 최대화되어야 정확도가 올라간다고 하였다. ?? a가 최소화되어야 dot과 가까워지는거 아닌가? 왜 굳이 최대화 시키려 하지? 왜 그럴까? 사실 a,b,c는 직각삼각형으로 이루어져 있다. 이 말은 a^2 + b^2 = c^2 이란거다. 근데 c는 dot이 움직이지 않기 때문에 고정적이다. 눈치 빠른 사람은 이미 알았을거다. c가 고정값이기 때문에 b가 최소화되면 반대로 a는 최대화가 된다. dot과 A' 선과의 거리를 ..
SVM에서 하드 마진과 소프트 마진의 차이 먼저 하드 마진이다. 하드 마진은 위의 그림과 같이 좀 타이트하다. 점선 두 개를 그어 그 사이에 초록색 별이 들어가는 것만 받겠다. 라고 생각하면 편하다. 소프트 마진의 경우 이름에서 보이듯이 하드보다는 좀 더 유연한데 점선에 입실론 값을 주어 조금 더 넓게 만들어 들어오는 초록색 별의 양을 조절할 수 있다는 것이다. 다른 점은 아무래도 입실론 값인데 앞의 SVM에서 배운 +C 라고 이해하면 좀 더 편할 것이다. 하드보다는 아무래도 유연한 소프트를 많이 사용한다고 한다.
규제화 모델 노트정리 및 코딩 규제화의 필요성 - 변수가 너무 많으면 규제화가 필요함. Lasso, Ridge 모델 - 모델 시각화 및 개념 비교 Lasso 모델 같은 경우 상하좌우 꼭지점에 맞춰짐. Ridge 모델 같은 경우 원의 끝(경계선?)에 맞춰짐. 예전같은 경우 Ridge 모델이 많은 변수 사용, 많은 패널티에도 불구하고 인기가 많았음. 하지만 컴퓨터가 발전하면서 연산처리 속도가 빨라졌고 그에 따라 적은 패널티, 높은 성능을 가진 Lasso 모델이 각광받는 중. 코딩 실습으로 넘어가본다. 먼저 os를 import, 원하는 파일을 읽어들인다. columns를 이용하여 컬럼들이 잘 들어왔는지 확인함과 동시에 원하는 타겟을 찾는다. 데이터 분할을 통해 X와 Y를 설정한다. 원하는 타겟을 ' ' 안에 코스피지수로 넣었다. 그 다음 ..
선형회귀모델 정리노트 및 코딩 통계학에서, 선형 회귀(線型回歸, 영어: linear regression)는 종속 변수 y와 한 개 이상의 독립 변수 (또는 설명 변수) X와의 선형 상관 관계를 모델링하는 회귀분석 기법이다. 한 개의 설명 변수에 기반한 경우에는 단순 선형 회귀, 둘 이상의 설명 변수에 기반한 경우에는 다중 선형 회귀라고 한다. (출처: 위키백과) 어렵다. 여기에는 순서가 좀 있는데 위 그래프에서 점들 사이에 먼저 1. 선을 그린다. - 점에서 가장 가까운 선으로 그린다. 2. 점의 y절편과 선 사이에 오차값을 구한다. - Y= b0 - b1X 라는 방법으로 구함. - 실제로는 마이너스 값을 없애기 위해서 오차에 제곱을 시켜주어 양수로만 출력 3. 오차값을 통하여 가장 제곱합을 최소화한 계수를 추정. - 아래 그림으로 ..
k 최근접 이웃 모델 강의노트 먼저, 분류와 예측에 따라 다르다. 분류모델 예측모델 거리 구하기 k 근접모델은 점 사이의 거리를 구해야 한다. 이 거리를 구하는 데엔 여러 공식들이 있다. 보통은 점과 점사이를 연결하는 선을 구하는 공식인 유클리디언을 이용하는데 예외가 있다고 한다. 다차원일 때에는 절댓값을 이용하는 Manhattan을 적용한다. 또 이 거리를 구하는 방식에는 여러 가지가 있다. 1. 마할라노비스 거리 2. 매칭 3. 자카드 장단점 정리 가장 큰 건은 계산량이 많다는 점이다. 들어올 때마다 계산해야 하는 속도면에서 큰 문제가 있다. 발전된 방법 k-d 트리 k차원 공간의 점들을 구조화 하여 공간 분할 자료 구조 한 것. 하지만 2012년 딥러닝의 출현으로 딥러닝이 모든 것을 커버했다고 한다.
문과생들을 위한 코딩 공부 방법 2020/07/15 - [컴공 대학생이 말하는 코딩 이야기] - 저는 문과인데요 코딩을 배울 수 있을까요? - 문송이들도 할 수 있는 코딩 저는 문과인데요 코딩을 배울 수 있을까요? - 문송이들도 할 수 있는 코딩 벌써, 컴퓨터공학과 4학년에 접어들었더니 여기저기서 이런 질문이 들어온다. 저기.. 저는 문과생인데요.. 원하는 회사가 코딩을 원하는데 지금 코딩을 배워서 회사에 들어가서 써먹을 수 있을�� successontouch.tistory.com 지난 글에는 코딩은 어렵지 않다는 주제로 이야기를 썼었습니다. 생각을 해보니 "여러분 코딩은 어렵지 않아요. 여러분도 할 수 있어요. 앞으로의 시대에서 코딩은 필수 불가결하고 여러분은 꼭 이걸 해야 해요."라고만 적어놓고 근본적으로 '그럼 문과생들은 어떻게 ..
저는 문과인데요 코딩을 배울 수 있을까요? - 문송이들도 할 수 있는 코딩 벌써, 컴퓨터공학과 4학년에 접어들었더니 여기저기서 이런 질문이 들어온다. 저기.. 저는 문과생인데요.. 원하는 회사가 코딩을 원하는데 지금 코딩을 배워서 회사에 들어가서 써먹을 수 있을까요..? 초등학교에서는 코딩 교육이 의무화되었고 구글과 삼성 등 전 세계의 굴지의 기업들이 원하는 인재상은 '문학적 지식을 갖춘 프로그래머'란다. 이제는 초등학생도, 문송이들도 피해 갈 수 없는 대 코딩 시대가 펼쳐졌다. 이 글로 인해 많은 사람들이 코딩에 대한 인식이 바뀌었으면 좋겠다. 첫 번째, 코딩은 어렵지 않다. 뭔 개소린가 싶을거다. 실제로 물어보러 오는 많은 사람들에게 이렇게 얘기해주면 반 이상은 이렇게 이야기한다. "코딩(Coding)은 어렵지 않아요?" 그럼 난 이렇게 대답한다. "이미 하고 있잖아?" "..
KFC 신메뉴 켄터키 통다리 구이 솔직한 후기 평점/리뷰 오늘 9시에 일하면서 친구랑 카톡하고 있었는데, 갑자기 친구가 카톡을 보내주더군요 야야 11번가에 KFC 특가 뜸 O__O!!!!!!!!!!!!!!!!! 일하는 중에 바로 결제부터 하고 치킨세트 문자까지 받았네요 그래서 점심시간에 바로 KFC로 뛰었갔슴다. 뭐 별 다른 내용 보기 싫을테니 거두절미하고 바로 치킨사진 보시죵. 와 진짜 사진으로 안담기는 비쥬얼이었어요. 진짜 맛있게 생겼더라구요. 처음 치킨을 받았을 때 냄새가 정말 ㅎㄷㄷ; 그리고 KFC 하면 뭐에여. 치킨이잖아여 다른 치킨에 비해 좋아하는게 여기 치킨이 진짜 겁나 커서 너무 마음에 들었어요 그리고 지금 11번가에서 이벤트중이라 저기에 KFC 그 뭐냐 오리지날 치킨? 핫크리스피 치킨? 뭔지 모르겠는데 저거 하 나 더에 콜라까지 줘서 통다리구이..