본문 바로가기

전체 글16

서강대 AISW대학원 입학기 - 2 안녕하세요 :) 서강대 AISW대학원 데이터사이언스 인공지능학과에 지원을 하고 면접을 보게 되었습니다. 참고로 서강대와 한양대는 면접 날자가 동일하게 진행되어 겹치면 한쪽을 선택해야하는 경우가 생겨요 :( 저는 한양대는 깔끔하게 포기하고 서강대만 진학하기로 마음 먹고 준비하였답니다. 서강대는 타임별로 나누고 그 타임에 면접자들이 다들어와서 준비하게 되는 과정인데요. 면접은 2:5 ( 면접관 2, 면접자 5 ) 로 진행되었습니다. 면접은 비전공자들과 전공자들이 섞여 함께보는데, 질문은 전공자와 비전공자들에 대해서는 다르게 진행해주십니다. 제가 들어갔던 조에서는 비전공자 셋, 전공자 둘이었는데, 비전공자 분들에게는 기본적인 회귀분석, 선형회귀, 미분의 개념등의 질문이 주어졌고, 전공자들은 기본적인 자료구조.. 2025. 4. 27.
서강대 AISW대학원 입학기 - 1 안녕하세요. :) 기술블로그 운영중인 진짜 산입니다. 현업에 치여 살다보니, 블로그에 논문 & 기술 리뷰하는 빈도가 올해 상당히 적었는데, 다시 블로그를 차근차근 기록하는 형태로 작성해보려고 합니다. 24년에는 많은 변화가 있었습니다. 2020년으로 돌아가 직장 + 학업의 진행 형태가 2025년부터 다시 재개될 예정입니다. :(, :) 대학원에 진학을 결심하고 갈 수 있는 대학들을 모색해 보았는데, (강서 거주 기준) 서강, 국민, 연세 등등이 존재했습니다.(연세대는 진학 시기를 놓쳐............) 저는 서강대과 국민대, 과기대 세군데에 지원을 했습니다. :) 서강대는 국민대와는 다르게, 네가지의 학과가 존재하며, 온라인 학위 수여 트랙은 존재하지 않습니다. 수업 또한 대부분이 야간에 진행.. 2025. 4. 27.
국민대 소프트웨어융합대학원 - 2 안녕하세요 :0 몰아 쓰는 24년 회고~~~~ 국민대 소프트웨어융합대학원 지원 2부 작성합니다. ~~~~ 대학원에 지원 이후 면접에 대한 이야기를 해보려고 합니다. 저 또한 대학원 면접은 처음이라 긴장을 많이 했습니다. 면접에 관련해서 어떤 질문이 오는 지 사람들이 굉장히 궁금해 할 것 이라고 생각하는데, 면접을 보자마자 기록으로 써 남겨놓았습니다. 대기실을 강당형 강의실 같은곳에서 20~30명 정도 되시는 분들과 함께 기다렸습니다. 제 차례가 거의 마지막이라서 조금 오래 기다렸던 기억이 있네요. 면접은 2:1 ( 면접관 2, 면접자 1) 방식으로 진행 됐습니다. 들어가자마자 가벼운 인적사항 본인 확인 후. 자기소개를 진행시킵니다. 저는 1분정도 되는 자기소개를 준비해 갔습니다. 제출 서류에 있는 경력.. 2025. 4. 27.
국민대 소프트웨어융합대학원 - 1 안녕하세요. :) 오랜만에 글을 남기는데, 현업과 기술 관련 글이 아닌, 대학원 관련 내용으로 찾아뵙게 되었네요. 다들 갑자기 무슨 대학원이냐 하실텐데, 현업에서 일하다보니 실무와 별개로 이론적으로 알아야할 지식, 실무와 이론이 접목되어야하는 부분이 많더라고요 ( ※ 특히 인공지능 관련 분야 ) 그래서 25년에는 대학원을 진학하여 보자 라는 다짐을 하게 되었습니다. 그래서 서울 서쪽에서 (강서) 거주하다보니 가까운 대학원들을 찾게 되었습니다. 그 중에 가장 유력한 후보는 국민대, 서강대 였습니다.(연세대는... 지원 시기를 아예 놓쳤네여.....) 직장인들이 갈 수 있는 대학원으로 특수 대학원이 존재하는데, 학업 + 현업 직장인을 배려해서 퇴근 시간 이후 or 주말에 수업을 진행해준 답니다. 국민대 소.. 2025. 4. 27.
DragonFly 다중 해상도 줌(확대)기능을 갖춘 Llama-3 기반 Vision Language Model 소개TogetherAI에서 공개한 Dragonfly는 Llama-3 기반의 새로운 비전-언어 아키텍처 모델로, 대규모 멀티모달 모델(LMM)의 발전을 기반으로 한 새로운 아키텍처이다. 고해상도 이미지가 시각적 세부 사항을 이해하는 데 중요한 역할을 하지만, 고해상도 입력은 언어 모델의 컨텍스트 길이를 연장시켜 비효율을 초래하고, 시각적 특성의 복잡성을 증가시켜 더 많은 훈련 데이터나 복잡한 아키텍처를 필요로 한다.이를 해결하기 위해 Dragonfly는 멀티 해상도 시각 인코딩과 줌인 패치 선택이라는 두 가지 주요 전략을 사용한다. 이러한 전략을 통해 모델은 고해상도 이미지를 효율적으로 처리하면서도 적절한 컨텍스트 길이를 유지할 수 있다. Dragonfly는 여덟 가지 인기 벤치마크에서 경쟁력 있는 성능을.. 2024. 6. 17.
MARS5: 혁신적인 음성을 지원하는 New 음성 모델 소개MARS5는 CAMB.AI에서 개발한 최첨단 TTS 모델로, 두 단계의 AR-NAR 파이프라인을 통해 동작한다. 아주 적은 시간인 5초 오디오와 텍스트 조각만으로도 다양한 프로소디 시나리오에서 높은 품질의 음성을 생성할 수 있다. 해당 모델은 텍스트와 참조 오디오를 입력 받아 다양한 운율 흐름에서도 자연스러운 음성을 생성할 수 있다. 특히 스포츠 해설이나 애니메이션 같은 프로소디가 어려운 시나리오에서도 뛰어난 성능을 보인다. MARS5의 독특한 점은 NAR 컴포넌트의 혁신적인 설계로, 자세한 내용은 Architecture문서에서 확인할 수 있다.MARS5는 기존의 TTS 모델들과 비교하여 혁신적인 특징을 갖추고 있다. 기존 모델들은 주로 단순한 텍스트-음성(TTS) 변환에 중점을 두었던 반면, MAR.. 2024. 6. 17.
반응형