목록전체 글 (34)
statduck
오기 생겨서 답 못맞춰도 일부러 고난이도 문제를 내보았다.(11번은 설명하기 난해해서 포기) 오답 오답이라 그냥 잘랐다. 근데 g(x) = h(x)-h(4)+h(x) 추론한건 신기하다. 오답 너무 당당하게 말해서 킹받는다.. n이 12보다 큰 케이스 고려하지 않았고 f(3)부터 잘못구했다.. 정답. 오우........ 이걸 맞춰? 아니 근데 이거 맞춘거 너무 신기하다. 근데 뽀록으로 맞춘느낌 너무 강하다. 오답 말도 안되는 소리... 너무 그럴듯하게 헛소리해서 더 짜증난다 ㅠ
수능 수학 문제를 나의 발영어로 번역해서(식은 마크다운 형식으로 적어서) ChatGPT한테 던져주면 문제를 풀 수 있을까? 2023년 수능수학 기준으로 작성하였으며 ChatGPT가 웬만하면 답을 맞출 때 까지 (헛소리 안할 때 까지, 계산 맞을 때 까지) 질문을 바꿔보고 다시 질문해보면서 정리한 결과가 다음과 같다. 오답 1번 문제에서 오답을 보여주다니... 실망이다. 오답 무작정 시도할 줄 알았는데 dominant terms으로 파악을 잘 해낸것이 신기. 근데 3x will become much larger than ~ 이라고 틀린 소리를 너무 당연하게 한다... 결국 답도 틀림. 오답 중간에 잘못계산해서 그냥 끊음... 아무리 많이 입력시켜도 계산이 계속 틀린다. 억! 정답 드디어 이 친구 답을 맞췄..
Generative Model이란?: 결국 데이터를 생성하는 모형이다. 데이터 생성은 결국 특정 분포를 따르는 확률변수에서 값들을 샘플링 하는 것과 같은 작업이라고 볼 수 있다. 과거의 데이터들이 어떤 분포를 따르는지 추정해서, 데이터들을 추가로 뽑는다고 생각하자. 여기서 중요한건 우리가 가진 데이터들의 분포를 제대로 알아내는 것, 학습하는 것이다. 예를 들어 https://arxiv.org/pdf/1406.2661.pdf 이 논문을 왜 썼는지 히스토리를 알아보자. Discriminative Model 기존에는 backpropagation, dropout 등의 테크닉으로 딥러닝에서 성공을 거두었다. Backpropagation은 목적함수를 최적화 하기 위해서 미분값들이 업데이트 되는 것이고 dropout..
목적: 표현 이해 $$ p(y|x;\theta) = Ber(y|f(x;\theta)) $$ $$ p(y|x;\theta) = Cat(y|f(x;\theta)) $$ Binary Classification. 우리가 알고있는 정보/데이터로 특정 값(Y)이 0일지 1일지 예측하는 태스크를 푸는것이 이진분류이다. Ex) 사람들의 건강정보(혈압, 몸무게, 키)가 주어지면 그 사람의 성별(남/여)을 예측하는 모델을 세우는 경우 해당 문제를 수리적으로 재 정의하면 $$ p(y|x,\theta) = Ber(y|f(x; \theta)), \; s.t. \; y\in \{0,1\} $$ 특정 데이터가 주어졌을 때 y가 일어날 확률을 예측하는 조건부분포 추정의 문제이다. - 어떤 데이터가 주어졌을 때: 특정 케이스에는 y가..
요약통계량은 적률(Moment)이라고 볼 수 있다. 이 적률은 함수의 모양을 결정짓는 녀석이다. 이 녀석으로 어떤 함수가 지나는 점을 기준으로 모양을 추정할 수 있다(데이터 포인트->분포추정) 평균, 분산, 최빈값 이런 요약 통계량(summary statistics)들이 예시이다. - 평균: 중심을 측정하는 척도. 선형 연산 성립 - 분산: 퍼진 정도를 측정하는 척도. - 최빈값(mode): 쌍봉분포에서는 유니크 하지 않을 수 있다 그렇지만 위 그림처럼 요약 통계량만 믿다가는 큰 코 다칠 수도 있다. 같은 요약통계량을 가지더라도 위와 같이 전혀 다른 데이터의 흐름 혹은 두 데이터의 관계를 설명하는 경우가 있기 때문이다. 1차원 데이터의 경우에는 아래처럼 박스플랏 대신 분포를 육안으로 설명해주는 바이올린플..
Ref: https://towardsdatascience.com/analyzing-seasonality-with-fourier-transforms-using-python-scipy-bb46945a23d3 Data: https://data.seoul.go.kr/dataList/OA-2218/S/1/datasetView.do 2020, 2021년도 데이터 이용 from scipy import fft from scipy import signal as sig import matplotlib.pyplot as plt import numpy as np import pandas as pd import math from pandas.plotting import register_matplotlib_converters r..
Python - BeautifulSoup, request 라이브러리 이용 BeautifulSoup? - HTML이나 XML 파일의 데이터를 당겨오는 라이브러리 requests?: http 호출 라이브러리 XML?: 내부적으로 트리구조를 가지는 마크업 언어 (html파일이 대표적) requests 사용법 import requests r = requests.get('https://api.github.com/user', auth=('user', 'pass')) r.status_code # 200 r.headers['content-type'] # 'application/json; charset=utf8' r.encoding # 'utf-8' r.text # doctest: +ELLIPSIS # u'{"type"..
ARIMA 모형 모형의 정상성 가정을 먼저 만족해야한다. AR(Auto Regressive)모형은 $$Z_t = \phi_1Z_{t-1}+ + \phi_2 Z_{t-2} + \phi_3 Z_{t-3} + \cdots + \phi_p Z_{t-p} + a_t $$ 이와 같이 나타나며, 이는 이전 시점의 데이터들을 t시점의 데이터에 회귀시킨 모형이다. * 단 회귀모형과는 달리 독립변수들간 독립성이 가정되지 않으며 독립변수 개수가 사전적으로 결정되는 것이 아니다. MA(Moving Average)모형은 $$ Z_t = a_t - \theta_1 a_{t-1} - \theta_2 a_{t-2} - \theta_3 a_{t-3} - \cdots - \theta_q a_{t-1} $$ 이는 $\{ a_t, a_{t..