해당 포스트는 대학 커뮤니티 게시글을 생성하는 AI 모델 UCK-GPT2를 소개합니다. INTRO 최근 AI기술은 실생활 다양한 곳에 적용되어 자연스럽게 활용되고 있습니다. 특히, 언어 관련 기술들은 가까이는 핸드폰의 시리, 빅스비에 적용되어 있고, 스마트 스피커에는 기가지니, 알렉사, 클로바, 카카오 등에 적용되어 사용되고 있습니다. 이러한 챗봇, AI 상담사 등의 서비스들은 기본적으로 고객의 질문을 이해하고, 준비된 답변 중 선택하여 출력하는 방식으로 처리가 되는데, 최근에는 준비된 답변이 아닌 질문에 맞게 언어를 생성하여 답변할 수 있는 기술이 공개 및 활용되고 있습니다. 아래 소개하는 UCK-GPT2는 언어 생성 모델 중 하나로, 대학 커뮤니티 글을 학습하여 언어를 생성이 가능한 한국어 언어 모델..
해당 포스트에서는 다양한 IT 도서들의 소스 코드 출처를 정리하여 공유하고 있습니다. 최근 업데이트 : 2022-02-23 골든래빗 나성호의 R 데이터 분석 입문 : Code 길벗출판사 머신러닝 교과서 with 파이썬, 사이킷런, 텐서플로 : Code 케라스 창시자에게 배우는 딥러닝 : Code 쉽게 시작하는 캐글 데이터 분석 : Code 모두의 딥러닝 : Code 딥러닝 워크북 : Code 비제이퍼블릭(BJ퍼블릭) 딥러닝에 목마른 사람들을 위한 PyTorch : Code 패키지 없이 R로 구현하는 심층 강화학습 : Code 에이콘출판사 한국어 임베딩 : Code 위키북스 실무 프로젝트로 배우는 데이터 분석 with R : [Code] , Free eBook 이지스퍼블리싱 Do it! 점프 투 장고 : ..
해당 포스트는 itdaily 기획특집 중 하나인 데이터 계보(Data Lineage) 관리에 대해 정리한 내용을 소개합니다. 데이터 계보(Data Lineage) 관리? 조직 내에서 데이터의 수집과 저장, 이동과 통합, 분석, 폐기에 이르는 모든 라이프 사이클을 추적하는 것 특정 데이터가 어떤 시스템에서 생성됐고 어느 DB에 저장됐는지, 이후 어떤 과정을 거쳐 현재는 어디서 활용되고 있는지 등을 투명하게 확인해 실시간으로 파악하는 것을 목적으로 함 데이터 리니지 절차 선제적 도입보다는 데이터 거버넌스 수립부터 해야 함 데이터 거버넌스는 조직 내에서 데이터의 정확성을 확보하고 품질을 높여 가치를 창출하기 위해 수행하는 모든 기술과 정책을 의미 국내에서 데이터 거버넌스를 갖추기 위해 가장 먼저 시작한 것은 ..
해당 포스트는 회사에서 진행한 컨퍼런스에서 발표된 내용 중 '좋은 개발자의 역할' 일부를 정리한 글입니다. 백지장도 맞들면 낫다!? 한국에는 '백지장도 맞들면 낫다'라는 속담이 있습니다. '아무리 쉬운 일이라도 협력하여 하면 훨씬 더 효과적이다' 라는 뜻으로 협력의 효과에 대해 전달하는 속담입니다. 그러나 분석/개발 업무를 하면서 공동 작업자가 많아질 수록 반대의 상황을 많이 보게 됩니다. 아이러니하게도 여러 명이 작업할 수록 구조는 복잡해 지고 단계도 많아지게 되면서 문제 본질의 해결이 아닌 주어진 태스크 수행/완수를 목표로 하게 되는 경우가 많았습니다.(물론 좋은 PM이 있다면 상황이 다를 수 있습니다.^^) 그럼 좋은 개발자가 되려면 위와 같은 상황에서 어..
해당 포스트는 'Korea R Conference 2021'에서 발표된 이영록 님의 '데이터 분석가의 R 패키지 개발 경험기' 영상을 보고 정리한 내용입니다. INTRO 나름 R을 오랫동안 사용해 온 유저이다보니 가능하면 한국에서 진행되는 R 관련 컨퍼런스는 다 참여하려는 편이다. 매년 진행되었던 한국 R 유저 모임이 올해는 온라인으로 진행(스트리밍과 녹화 영상)되었고, 예전 R 패키지를 만들다 포기했던 아픈 기억을 자극하는 발표가 있어 관심을 가지고 시청하게 되었다. 아래는 이영록님이 말씀하신 내용 중, 개인적으로 나중에 필요할 것으로 판단되는 내용들을 남겨놓았다. 다른 발표 내용은 아래 링크에서 확인할 수 있습니다. Korea R Conference 2021 - Progr..
해당 포스트는 과학기술정보통신부에서 주최하는 2021 인공지능 데이터 활용 경진대회에 대해 소개하는 글입니다. INTRO 과학기술정보통신부에서 주최하는 이번 경진대회는 3개 분야(lifestyle, industry, public)에 AI 서비스를 발굴하는 것을 평가하는 대회이며, 대상에게는 과기정통부 장관상 및 1,500만 원의 상금이 수여되는 큰 경진대회입니다. 이번 대회는 대한민국 국민이면 누구나 참가할 수 있으며, 대회 기간은 12월 1일까지로 여유가 있는 편입니다. 입상팀에게는 상금 외에도 다양한 특전도 수여될 예정이니 관심 있으신 분들은 지원해보시면 좋을 것 같습니다. 자세한 내용은 아래 정리하였으니 확인해 보세요! 참여 절차 및 일정 인공지능 서비스 기획/개발에 관심 있는 대한민국 누구나 참여..
해당 포스트에서는 Google Responsible AI에 대해 소개합니다. Responsible AI? AI의 발전은 비즈니스, 의료, 교육 등 전 세계 사람들의 삶을 개선할 수 있는 새로운 기회를 창출하고 있습니다. 또한 이러한 시스템에 공정성, 해석 가능성, 개인 정보 보호 및 보안을 구축하는 최상의 방법에 대한 새로운 의문도 제기하고 있습니다. 이러한 의문은 아직 해결되지 않았으며, 실제로 연구 및 개발의 활발한 영역입니다. Google은 AI의 책임 있는 개발에 진전을 보이고 지식, 연구, 도구, 데이터셋 및 기타 리소스를 더 큰 커뮤니티와 공유하기 위해 노력하고 있으며, 해당 포스트에서는 Google의 현재 작업 및 권장 작업 방식 중 일부를 공유합니다. AI 권장 사례 신뢰할 수 있고 효과적..
해당 포스트는 NH투자증권에서 주최하는 2021년 NH투자증권 빅데이터 경진대회에 대해 소개하는 글입니다. INTRO NH투자증권에서 주최하고 데이콘(DACON)에서 운영하는 이번 경진대회는 주식 보유기간을 예측하는 예선과 빅데이터를 활용한 서비스 아이디어를 제안하는 본선으로 나누어 진행됩니다. 이번 대회는 국내/해외 대학(원) 생으로 이뤄진 개인 및 팀만 참가할 수 있으며(일반인 참가 불가), 대회 기간은 8월 23일부터 11월 26일까지로 여유가 있는 편입니다. 입상팀에게는 상금 외에도 서류전형 면제, 체험형 인턴 기회를 제공하고 있으니 관심있으신 분들은 지원해보시면 좋을 것 같습니다. 자세한 내용은 아래 정리하였으니 확인해 보세요! 2021년 NH투자증권 빅데이터 경진대회 정보 1. 참가 대상 국내..
해당 포스트는 문화체육관광부와 국립국어원이 주최하고, SKT와의 협업으로 진행되는 '2021 국립국어원 인공 지능 언어 능력 평가' 대회에 대해 소개합니다. INTRO 문화체육관광부와 국립국어원이 9월 1일(수)부터 두 달간 ‘2021 국립국어원 인공 지능 언어 능력 평가’ 대회를 개최합니다. 작년까지는 '국어 정보 처리 시스템 경진 대회'를 진행했었는데 올해부터는 글루(GLUE), 슈퍼글루(SuperGLUE) 등 해외 인공지능 언어 이해 평가 능력 과제를 반영하였습니다. 이번 대회의 과제는 총 4개의 문제를 풀어야하며, 참가자가 개발한 모델을 이용하여 문제를 풀고 제출하면 Squad나 Korquad와 같이 답안 채점 결과를 스코어링 하여 순위표(리더보드)에 게시됩니다. 참고로 SKT와 협력해서인지 베이..
해당 포스트는 '한국 R 컨퍼런스 2021' 에 대한 정보를 공유하는 글입니다. 1. 컨퍼런스 소개 R 사용자회 에서 주관하는 이번 컨퍼런스는 2021년 11월 19일 금요일 10:00~17:00에 온라인 라이브로 진행될 예정입니다. 내일(8월 30일) 발표모집이 마감되면 9월 10일 확정된 프로그램이 공개되고 9월 17일부터 행사 등록이 시작됩니다. R User Conference 행사를 매년 참석하면서 좋은 정보들을 얻어왔었기에 올해도 등록 신청이 오픈되면 참석할 예정입니다. 아직 프로그램 및 연사분들이 확정되지 않았으나 현재까지 등록된 분들의 발표자료 초록을 봤을 땐 아래 3개 주제가 개인적으로 기대됩니다. 1. 프로덕션 수준의 리포트 자동화 시스템 만들기 발표자 : 이민호/김사현 (소속 : 데이터..