본문 바로가기
Microsoft/Azure ML

Azure ml로 OH MY GIRL(오마이걸) _ Nonstop(살짝 설렜어)시계열로 조회수 예측!! 3000만은 언제 오는가....!!!!! 옴망진창

by AttractiveS 2020. 6. 4.

 

 

 

군대에서도 후배들... 음악프로 본다고 날 리 칠 때  영화나..드라마 본 내가............요즘....음악프로를 챙겨본다ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ

 

오! 마! 이! 걸!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!하...너무 좋아...어쩌지.....

 

살짝 설렜어 뮤비를 보던중...어느덧 조회수....29552534!!!

 

언제 3천만 될까 하던 중......내가 계산 하기로 하였다!!!! 먼저....데이터 뽑아내기....

 

 

오마이걸 살짝 설렛어 조회수

 

 

리얼 수동으로 데이터를 뽑아내기...정성 무엇 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ 11시부터 회사에서 확인 후 메모...10분 단위로 메모....(님 모하심.....ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ)

 

7개 데이터로 시계열을 먼저 돌려보았다..!!!! 이짓을...하루 종일 할수 는 없잖아 ㅠㅠ

 

 

 

 

먼저 엑셀 Forecast 함수로 대충 구해보았다!!! 그랬더니 2020 6월 6일 새벽 5시!!! 으흠.... 과연?

그 다음 Azure ML에 데이터 5개를 쏙 넣어보았다!!

 

OHMYGIRL3000(0603).csv
0.00MB

 

 

잘 들어 갔군!! ㅇ___ㅇ

 



 

그다음은 마이크로소프트에서 제공하는 시계열 모듈을 가지고 와야 사용할 수 있다!!

물론 본인이 R로 짜서 사용 가능하나...모르니 가져오도록 하자.....

아래 + 버튼을 누르고 왼쪽 Module 버튼을 누르면 다양한 모듈이 나오는데 그중 시계열을 선택해서 Import Module 하면 사용을 할 수가 있습니다~~~

 

 

 

 

 

 

아래 사진처럼 Custom에 들어가면 우리가 추가한 시계열 모듈을 찾을 수가 있습니다.

 

그중에서 Train Score Timeseries와 Score Timeseries를 가지고 옴니다.

 

 

 

 

그다음 아래 처럼만 연결해도 바로 사용 할 수가 있습니다!!!

 

 

 

Train Score Timeseries 옵션을 보면 가장 먼저 어떤 데이터를 훈련 시키고 결괏값이 나올 친구를 고르고!!

 

다음은 얼마큼 예측할지 데이터양을 고를 수 있습니다. (Predictions)

 

또 계절성이라는 것이 있는데요. 데이터가 어떤 식으로 주기적 반복하는지를 적는 곳입니다.

 

이 계절성은 엑셀로 확인을 할 수가 있는데요.

 

 

 

 

Forecast.ETS.seasonality라는 함수를 통해서 이런 식으로 구할 수가 있습니다. 지금은 계속 오르는 데이터라 계절성이 없는 것을 확인할 수 있습니다. Azure ml에서 계절성은 0을 적을 수 없어 1을 집어넣도록 합시다.!!

 

 

 

 

 

 

 

시계열 함수는 여러 가지가 있는데 저희는 두 가지를 이용할 것입니다

 

먼저 Arima 함수를 이용할 건데요. 아리마 함수는 이전 데이터가 이후 데이터 영향 미칠 때 사용합니다.

 

 

Score Timeseries 옵션에는 몇 개의 데이터가 나올지만 적어 주시면 됩니다.

 

 

 

 

그리고 돌리시면!!!

 

99개의 예측 데이터가 나옵니다!!! ㄷㄷㄷㅈ!!!!

 

 

 

 

 

 

그런데 보시면 시간대를 정확히 알 수가 없어서.............

 

그래서 저는 먼저 실제 데이터를 확인합니다.

 

 

 

 

 

 

3시 34분 -> 29589959 이것을 예측 데이터에서 비슷한 데이터를 찾습니다.!!!!

 

26번째에 있네요!!!!!

 

 

 

그러고 나서 엑셀에 이렇게 10분 단위로 만들고 그 옆에 몇 번째 숫자인지를 적습니다.!!!

 

 

 

 

 

 

그 다음 26부터 36까지 늘어나 비율 별로 쭉 늘이기!!!!! ㅋㅋㅋㅋㅋ 진짜 이게 맞나 싶지만 그냥 그렇게함!!!

 

 

 

그리고 그 숫자에 맞는 나머지 숫자를 채워 넣습니다.

 

 

 

 

71번 칸에는 29640634 이런 식으로 채워 넣고 이제 이 자료를 통해서 다시 시계열 분석을 사용합니다.

 

아까 생성된 자료를 다시 Azure ml에 넣고 다시 시계열을 돌립니다.

 

 

 

 

이번에는 시계열 함수에서 ETS 함수를 사용할 건데요!!! 보통 주기적으로 변하는 계절성이 뚜렷할 때 사용합니다.

 

조회 수 증가가 늘어만 나서 딱히 계절성은 없지만... 시간에 따라 올라가는 정도가 차이가 크니 ETS를 사용해 봅니다!!!

 

 

 

그리고 돌리면!!!  이렇게 쭈욱~~~~ 나오는 데여!!! 99번째에가면 (29907304)

예상데이터가 납옵니다.!!!! 

 

 

그럼 그게 몇시 몇분인지 알아 볼까요!!!!

6월 4일 8시 34분에 실제 데이터는 29764507 이었습니다.!!! 그 숫자는 39번째쯤에 있었는데요!!!

그리고 몇개를 좀 비교를 해서 채워 넣습니다. 그리고 그 숫자들을 또 비율에 맞게 쭉우우욱~~ 늘리면 

 

 

99번째가 29907304.438485 예상데이터인데

6월 5일 9시 44분에 98.6번째는 한 29905000정도 될꺼 같습니다.!!!!!????ㅇㅅㅇ?? 맞을까...;;;;

그럼...3000만은 한 10시 쯤 되지않을까여......ㅇㅅㅇ??

 

 

그럼...기다리고 기다려 6월 5일이 되었습니다!!!! 9시 44분!!!

이미 3천만에 가까워저있는.......조지게 설렜어..................

 

 

 

최종적으로.....결과는 6월 5일 9시 48분!!!! 

 

좀더....소수점까지 완벽하게 비율을 맞췄으면...정확했을 수도.....;;;;ㅇㅅㅇ;;; 아닌가..............여튼 옴망진창

 

이상.....Azure ml로 OH MY GIRL(오마이걸) _ Nonstop(살짝 설렜어)시계열로 조회수 3000만예측이었습니다.......

 

 

 

반응형