분류 전체보기 197

작업 기록과 관련된 git 명령어

diff단독으로 사용했을때는 unstaged된 상태에서의 차이만 비교가능staged 옵션 추가하면 staged된 상태에서 차이 비교 가능git diff --staged수정사항은 vscode에서 open changes 클릭해도 확인가능 vscode의 soruce control 창에서도 확인 가능 git log커밋 기록 보기 명령어이고, 커밋아이디를 확인 가능 git log -p특정 커밋에 어떤 수정사항들이 있었는지도 함께 확인 가능vscode의 source control -> commit 에서도 수정사항들 확인 가능 git restore커밋되지 않은 변경사항 되돌리고 싶을때 사용하는 명령어git add 한 뒤라면 git restore --staged 하면 unstaged상태로 되돌아감vscode의 sour..

[Git & Github] 2024.10.01

SQLD 합격

MYSQL 코딩 테스트 문제를 꾸준히 조금씩 풀고 있었고(시험 공부 시작 전까지 100문제 정도 풀었었던 상태) & 구글 BigQuery를 다루는 연습을 하고 있었기에 나름대로 SQL을 어느정도 다룰 수 있다는 자신감이 있던 상태에서 시험 공부를 시작했다. 열흘정도 이론공부를 하고, 모의고사도 3회 정도 풀고 시험장에 갔다.SQLD 시험의 경우 필기이기 때문에 몇십줄 지문의 쿼리를 눈으로 읽고 머리에 쿼리가 구현된 결과를 떠올리며(=상상하며) 시험 문제를 풀어야 한다. 따라서 생각보다 시간이 오래 걸렸던 시험이었다. 아마 SQL에 대한 지식이 전혀 없는 사람이 시험공부를 시작한다면 시간을 많이 투자해야 합격할 정도의 난이도라고 생각한다.     ps.이번년도 첫번째 목표였던 '데이터 분석 관련 자격증 3..

빅데이터 분석기사 실기 합격

빅데이터 분석기사 최종 합격하고 두달여 후기를 못쓰다 이제야 쓰게 됐다.실기같은 경우 이미 컴퓨터공학 부전공으로 단순한 게임 몇 개 정도 만들 수 있는 정도에서 시작한 경우라,데이터 전처리와 머신러닝 같은 경우 쉬운 편이었고, 통계분석 같은 경우 필기에서 다룬 내용을 실습해보는 정도의 수준으로 또한 적당한 난이도였던 것 같다.아마 머신러닝 부분에서 많은 사람들이 점수를 얻어서 합격점을 달성할 수 있을 것이고,고득점을 원한다면 통계분석을 파는 것을 추천한다.시험관련 카페를 훑어본 결과2과목에서 사람들이 대부분 만점에 가까운 점수를 획득하고, 3과목에선 통계분석에 익숙치 않은 비전공자들이 점수를 잘 얻지 못한 것을 알 수 있었다.

리텐션 추가 분석 : 코호트 리텐션

코호트 리텐션- (통계적으로 동일한 특색이나 행동 양식을 공유하는) 집단     테이블 구조 first_week(가입한 주) | weeks_after_first_week(가입한지 n주) | active_users(해당 주차에 활동하는 유저 수) | cohort_users(가입 첫 주의 총 유저 수) | retention_rate(리텐션 비율) 미리보기 테이블에서 추출 -> 적용 순서는 퍼널,리텐션 시각화의 과정과 똑같다           행 : first_week열 : week_after_first_week값 : retention_rate (AVERAGE)      조건부 서식을 설정하는데, 시각화의 편의를 위해서 0이 아닌 1의 값들부터 끝까지 드래그 하여 설정한다                위의 그래..

[Other skills] 2024.09.14

Google Sheets로 Retention Curve 시각화하기

쿼리를 통해 Weekly Retention Curve를 추출해 내었다. 이 상태에서,      퍼널 시각화와 동일하게 쿼리 결과를 스프레드시트로 탐색한다.이번 리텐션 시각화는 퍼널 시각화와 좀 다르게미리보기 데이터를 그대로 추출하지 말고쿼리를 연결하여 데이터를 바꿔보자      내가 작성한 쿼리에는 WHERE 조건을 걸어서 2022-08-01 ~ 2022-11-03 까지의 기간의 데이터만 가지고 결과를 추출했었는데, 데이터 -> 데이터 커넥터 -> BigQuery에 연결 을 눌러준다.           조건문의 기간을 설정(2022-08-01 ~ 2023-08-03)하면,      이어서는 '퍼널 시각화하기(https://indong1998.tistory.com/80)'의 순서와 동일하다.추출 -> 적용..

[Other skills] 2024.09.14

리텐션의 종류

(1) Classic 리텐션(N day 리텐션)  - 사용자가 최초로 "참여"한 Day 0 이후, 각 Day N 별로 한 번 더 "참여"했는지 계산  - 제일 보수적인 접근. 낮은 값이 나올 수 있음  (2) Range 리텐션(Bracket 리텐션)  - Day N이 아닌 특정 Range 내에서 더 "참여"했는지 계산  - 제일 유연하고, 실용적인 관점  (3) Rolling 리텐션(Unbounded 리텐션)  - Day N 이후에 한 번이라도 "참여"한 경우를 그 동안을 모두 참여했다고 간주  - 가장 낙관적인 접근. 높은 값이 나올 수 있음  - 최근에 유저가 참여하면 과거에 본 데이터가 달라질 수 있음   리텐션 선택 기준Classic 리텐션  - 사용자가 제품을 정기적으로 사용하는 경우(매일 음식..

[Other skills] 2024.09.12

리텐션 분석의 큰 흐름

byBigQuery(SQL) 활용편(퍼널 분석, 리텐션 분석) 강의 | 카일스쿨 - 인프런 (inflearn.com) BigQuery(SQL) 활용편(퍼널 분석, 리텐션 분석) 강의 | 카일스쿨 - 인프런카일스쿨 | Google Analytics 4, Firebase 데이터의 형태의 앱 로그 분석을 진행합니다. 배열, 윈도우 함수, 퍼널, 리텐션, Google Sheets 등 실무에서 사용할 때 유용한 내용들을 담았습니다., Google Analytics 4,www.inflearn.com

[Other skills] 2024.09.12

퍼널 시각화하기 Using Connected Sheets | BigQuery (2)

(구분선 - 텍스트 - 사진 / 구분선 - 텍스트 - 사진 / ... /  순으로 작성) 연결된 시트에서 매개 변수 사용하기추출 -> 연결 설정을 클릭하면 사용했던 쿼리를 확인할 수 있음 쿼리를 수정해서 저장할 수 있고, 매개변수(셀의 특정 위치)를 클릭해 동적으로 쿼리가 실행될 수도 있음  쿼리의 event_date기간 설정을 매개변수(파라미터)로 정의해서 원하는 기간으로 추출하도록 설정추출에서 직접 데이터를 설정할 수도 있으나, 추출의 쿼리가 바뀔 경우 깨질 수 있기에 시트1에 값을 저장  추가를 누를 경우 쿼리의 하단에 매개 변수가 추가됨쿼리에선 @매개변수이름 으로 사용  처음 추출할때의 데이터는 2022-08-18까지 였으나, END_DATE를 2022-08-10으로 설정했었고,새로고침 클릭  데..

[Other skills] 2024.09.06

퍼널 시각화하기 Using Connected Sheets | BigQuery (1)

(텍스트 - 사진 / 텍스트 - 사진 / ... /  순으로 작성) 연결된 시트(Connected Sheets)- BigQuery의 데이터를 Google Sheets로 추출- 스케줄링 기능 : 반복 실행- 매개변수 활용 가능  연결된 시트를 사용한 퍼널 데이터 시각화일자별로 퍼널을 집계한 쿼리를 실행 -> 데이터 탐색 -> 스프레드시트로 탐색  연결된 시트(Connected Sheets)로 파일 생성  연결된 시트를 사용한 퍼널 데이터 시각화1번째 연결된 시트 : BigQuery와 Google Sheets가 연결됨  연결된 시트를 사용한 퍼널 데이터 시각화데이터 좌측 아래에 새로고침 아이콘 -> 새로고침 옵션  새로고침 옵션으로 반복 주기 설정 가능- 시간 간격, 일, 주 등- 반복 시간을 넓게 설정할 ..

[Other skills] 2024.09.06