728x90
반응형

분류 전체보기 75

[TIL #3 | 데이터 팟캐스트] 'Sky: 빛의 아이들' 게임 데이터 분석

이번 주 들은 팟캐스트: 의 "Lessons from eGamer Networks" https://podcasts.apple.com/gb/podcast/lessons-from-egamer-networks/id890348705?i=1000677335001 Lessons from eGamer NetworksPodcast Episode · Data Skeptic · 18/11/2024 · 38mpodcasts.apple.com  이 에피소드는 박사 과정 학생인 Alex Bisberg의 연구를 중심으로, 멀티플레이어 온라인 게임에서의 사회적 행동 분석 연구에 대해 이야기한다. 연구는 Sky: Children of the Light라는 게임을 기반으로, 게임 내에서 어떻게 플레이어들 간의 관대함(generosit..

[해외] 학술 포스터 & 발표 준비

이번 주에 있을 첫 학술 포스터 발표를 앞두고 A0 크기의 포스터와 발표를 준비하면서 느낀 점을 정리해 봤다. 이번에 포스터를 제작하면서 받은 피드백과 내가 느낀 점을 토대로 글을 작성해 봤다. 포스터 제작 과정A0 포스터는 생각보다 정말 크다. 84.1 cm x 118.9 cm라는 크기를 머리로는 이해했지만, 화면으로 봤을때는 실감이 나지 않았다. 실제로 출력된 포스터를 받아보니 그 크기에 당황스러울 정도였다. 다행히 대학교에서 제공한 템플릿이 있어서 그 구조를 따라 만들었다. 파워포인트를 사용하여 제작을 했지만 파워포인트가 없다면 구글 슬라이드로도 충분하다.학회에서 포스터 템플릿이나 특정 요구사항을 제공하지 않았기 때문에, 우리 학교 템플릿을 사용했다.   포스토 구조대학교에서 제공된 템플릿  구조는..

데이터 과학자를 위한 수학 유튜브 채널 추천!

데이터 과학자로서 선형대수, 미적분, 통계학 같은 수학 개념은 필수이다. 머신러닝과 딥러닝 모델을 제대로 이해하려면 수학 공부가 반드시 필요하다. 그런데 글로만 배우다 보면 개념이 명확하게 와닿지 않을 때가 많다. 그럴 때마다 찾게 되는 곳이 바로 유튜브이다. 글로만 봐서는 이해가 잘 안 되던 개념도, 다른 시각적 표현이나 설명 방식으로 접하면 훨씬 더 쉽게 이해될 때가 많기 때문이다. 물론 유튜브 영상만으로 완벽하게 공부하기는 어렵다. 하지만 영상을 통해 전체적인 개념을 먼저 이해하고, 이후에 더 깊이 있는 공부를 이어가는 방식으로 학습하는 데 큰 도움이 된다. 그래서 오늘은 내가 정말 많이 참고해 온 유튜브 채널 두 개를 추천하려고 한다. 이미 많은 분들이 알고 계실지도 모르지만, 혹시 모르는 분들을..

[TIL #3] 이번 주 AI 뉴스 정리 (Gemini 모델, GPT는 수포자?, 트럼프 & AI)

구글, 새로운 Gemini 모델구글이 최근에 발표한 Gemini 모델이 LLM 리더보드인 Imarena Chatbot Arena 차트에서 GPT-4o를 제치고 1위를 차지했다. Imarena Chatbot Arena(구 LMSys Arena): 이 플랫폼은 블라인드 테스트 방식을 사용해 사용자들의 투표로 순위를 정하는 방식이다. 새 모델은 수학, 시각적 이해, 추론 능력 성능이 크게 향상되었다고 한다. 현재는 API나 구글 AI Studio을 통해서 사용해 볼 수 있다. 아직 공식적인 발표는 없으나, 다음 달 출시 예정인 Gemini 2 초기버전일 거라 추측이 나오고 있다.  출처: https://www.tomsguide.com/ai/google-gemini/google-drops-new-gemini-m..

Git 서브모듈 (submodule) 사용하기

서브모듈 (submodule)Git 서브모듈은 하나의 Git 저장소 안에 다른 Git 저장소를 포함하고 관리할 수 있도록 해주는 기능이다. 주로 독립적으로 관리되는 코드를 포함하거나, 여러 프로젝트에서 공통적으로 사용하는 구성 요소를 공유해야 할 때 사용된다.서브모듈은 별도의 Git 저장소로 관리되며, 상위 저장소와 독립적으로 커밋 및 브랜치를 유지합니다. 즉, 서브모듈의 변경 사항은 상위 저장소의 변경 이력(히스토리)에 직접 영향을 미치지 않는다. 🔖 저장소 Repository: 프로젝트 파일과 변경 이력을 관리하는 Git의 기본 단위. 로컬(내 컴퓨터)이나 원격(GitHub 등)에 저장될 수 있다.🔖 모듈 Module: 특정 기능이나 역할을 수행하는 프로젝트의 논리적 구성 요소   나 같은 경우,..

[AI | 통계] 카파 상관계수 (Cohen's Kappa) feat. scikit-learn 코드 예제

코헨의 카파(Cohen's kappa, κ) 점수는 두 관찰자가 어떤 항목을 분류할 때 얼마나 일치하는지, 그리고 그 일치도가 우연 때문이 아닌지를 평가하는 지표이다. 예를 들어, 두 사람이나 딥러닝 모델이 소셜 미디어 게시물을 검토하고 '적절함' 또는 '부적절함'으로 분류한다고 가정해 봤을 때, 두 평가자(또는 모델)가 얼마나 일치했는지를 확인하려면 코헨의 카파 점수를 계산할 수 있다. 공식:   p_o​: 관찰된 일치 비율, 즉 평가자들이 실제로 일치한 비율을 의미p_e: 우연히 일치할 가능성을 나타내는 기대 일치 비율 값의 해석:κ=1: 완전한 일치.κ=0: 우연과 동일한 수준의 일치.κ0: 우연보다 낮은 수준의 일치.보통 다음과 같이 해석한다:0.81–1.00: 거의 완벽한 일치.0.61–0.80..

[호주] AI 스타트업 워크샵 후기

AI 스타트업 워크샵 후기링크드인을 둘러보다가 우연히 발견한 AI 스타트업 워크샵. 정부 지원을 받아 8주간 무료로 진행되는 온라인 프로그램이었고, 스타트업 창업자뿐 아니라 관심 있는 누구나 신청할 수 있다는 점이 마음에 들어 지원했다. 사실, 내가 현재 진행 중인 연구가 상업화 가능성이 있다는 이야기를 슈퍼바이저와 나눈 적이 있어 이 프로그램이 더욱 눈에 들어왔던 것 같다. 그렇게 어쩌다(?) 합격하게 되어 워크샵에 참여하게 되었다.워크샵의 구조와 첫인상일주일에 한 번, 퇴근 후 1시간 반 동안 진행되는 온라인 워크샵은 스타트업 관련 강연과 참여자들 간의 네트워킹 세션으로 구성된다. 강연은 스타트업의 기본적인 이론부터 실질적인 실행 방법까지 다루며, 브레이크아웃 룸에서 다른 참가자들과 아이디어를 나누는..

[파이썬 pandas] 데이터 프레임 열 데이터 타입 확인 및 변경하기

판다스에서 데이터를 다룰 때, 데이터 유형을 이해하고 적절히 관리하는 것은 매우 중요합니다. 올바른 데이터 유형을 사용하면 계산 오류를 방지하고, 정확한 분석과 시각화를 가능하게 하며, 효율적인 데이터 처리를 할 수 있습니다. 이 글에 사용할 예제 데이터 프레임을 만들어 보겠습니다.이번 예제에서는 책 데이터베이스를 분석한다고 가정해 보겠습니다. 제목, 저자, 발행 연도, 가격, 재고 여부와 같은 정보를 포함한 데이터프레임을 사용해 데이터 유형을 확인하고 적절히 변경하는 방법을 배워보겠습니다. import pandas as pddata = { "Title": ["To Kill a Mockingbird", "1984", "The Great Gatsby", "The Catcher in the Rye"],..

[GenAI #1] 생성형 인공지능 (Generative AI)이란?

생성형 AI란?생성형 AI는 입력된 프롬프트(질문, 요청, 설명 등)에 따라 새로운 콘텐츠(텍스트, 이미지, 동영상, 음악, 코드 등)를 생성하는 인공지능 기술이다. 기존 데이터를 학습하여 그 구조와 패턴을 이해한 후, 이를 바탕으로 독창적이거나 창의적인 결과물을 만들어냅니다.  주요 특징학습 및 생성 능력대규모 데이터 세트를 기반으로 패턴과 관계를 학습.학습한 데이터를 토대로 새로운 텍스트, 이미지, 음성, 코드 등을 생성.활용 분야텍스트 생성: 예) ChatGPT를 사용해 글쓰기, 이메일 작성, 대화 생성.이미지 생성: 예) DALL·E와 MidJourney로 예술 작품, 제품 디자인.음악 및 음성: 음악 작곡, 음성 합성.코드 생성: GitHub Copilot으로 코드 작성 보조.비디오 제작: 간단..

데이터 과학자가 알아야 할 수학: 얼마나 알아야 할까?

데이터 과학에 얼마나 많은 수학이 필요한가? 최근 몇 년간 데이터 과학은 주목받는 직업 중 하나로 자리 잡았다. 데이터 과학은 컴퓨터 과학, 통계학/수학, 그리고 도메인 지식을 결합한 다학문적(interdisciplinary) 분야로, 데이터를 분석하고 인사이트를 도출하며 의사결정을 지원하는 데 핵심적인 역할을 한다. 데이터 과학자의 역할은 회사와 상황에 따라 다양하지만, 이번 글에서는 데이터 과학에서 일반적으로 요구되는 수학적 지식의 수준을 정리해 보았다.  이 글은 호주에서 일하고 있는 사람이 작성한 만큼, 다른 상황에서는 다를 수 있습니다. 여러분의 경험과 의견이 다르다면 댓글로 자유롭게 공유해 주세요!  데이터 과학자에게 수학이 필요한 이유데이터 과학의 핵심은 데이터를 이해하고 이를 기반으로 정보..

728x90
반응형