본문 바로가기

Vision6

Computer Vision Feature Detection 완벽 가이드: 기초부터 실전까지 - 3 OpenCV 기반 Feature Detection 종합 튜토리얼Point Feature (SIFT, SURF, ORB) + Line Feature (Hough, LSD) + 실전 프로젝트목차Feature Detection이란?왜 Feature Detection이 중요한가?좋은 Feature의 조건Point Feature DetectionLine Feature DetectionFeature Matching실전 프로젝트성능 비교5. Line Feature Detection5.1 Hough TransformHough Transform은 직선, 원, 타원 등의 파라메트릭 형상을 검출하는 강력한 방법입니다.5.1.1 기본 원리핵심 아이디어: 이미지 공간의 점들을 파라미터 공간으로 변환직선의 표현:1) 직교 좌표계.. 2025. 11. 17.
Computer Vision Feature Detection 완벽 가이드: 기초부터 실전까지 - 2 OpenCV 기반 Feature Detection 종합 튜토리얼Point Feature (SIFT, SURF, ORB) + Line Feature (Hough, LSD) + 실전 프로젝트목차Feature Detection이란?왜 Feature Detection이 중요한가?좋은 Feature의 조건Point Feature DetectionLine Feature DetectionFeature Matching실전 프로젝트성능 비교 및 최적화4. Point Feature Detection 상세4.1 Harris Corner DetectorHarris Corner Detector는 1988년 Chris Harris와 Mike Stephens가 개발한 고전적인 코너 검출 알고리즘입니다. 4.1.1 이론적 배경핵심 .. 2025. 11. 17.
카메라 캘리브레이션 ( Camera Calibration ) - 2 2. 주점 (principal point) 주점 cx, cy는 카메라 렌즈의 중심 즉, 핀홀에서 이미지 센서에 내린 수선의 발의 영상 좌표(단위는 px)로서 일반적으로 ㅁ라하는 영상 중심점(image center)과는 다른 의미입니다.예를 들어, 카메라 조립 과정에서 오차로 인해 렌즈와 이미지 센서가 수평이 어긋나면 주점과 영상중심은 다른 값을 가질 것입니다. 영상기하학에서는 단순한 영상 중심점 보다는 principal point가 훨씬 중요하며 영상의 모든 기하학적 해석은 이 주점을 이용하여 이루어집니다. 3. 비대칭 계수(skew coefficient)비대칭 계수 skew_c (Intrinsic properties 행렬의 [0.1] 부분)는 이미지 센서의 cell array의 y축이 기울어진 정도를.. 2025. 11. 13.
카메라 캘리브레이션 ( Camera Calibration ) - 1 카메라 캘리브레이션이란? 영상처리, 컴퓨터 비전 분야에서는 카메라 캘리브레이션은 필요한 과정 중 하나입니다. 실제로 우리가 눈으로 보는 세상은 3차원입니다. 하지만 이것을 카메라로 찍으면 2차원의 이미지로 변하게 됩니다.이 때, 3차원의 점들이 이미지 상에서 어디에 맺히는지는 기하학적으로 생각하면 영상을 찍을 당시의 카메라의 위치 및 방향에 의해 결정됩니다.하지만 실제 이미지는 사용된 렌즈, 렌즈와 센서와의 거리, 렌즈와 센서가 이루는 각 등 카메라 내부의 기구적인 부분에 의해서 크게 영향을 받습니다.따라서, 3차원 점들이 영상에 투영된 위치를 구하거나 역으로 영상좌표로부터 3차원 공간좌표를 복원할 때에는 이러한 내부 요인을 제거해야만 정확한 계산이 가능해집니다. 이러한 내부 요인의 파마리터 값을 구하는.. 2025. 11. 10.
서강대 대학원 영상인식시스템 후기 (AI/SW) (1/5) 두번째 과목의 후기글로 찾아뵙습니다~ 여름철 다들 더위 조심하세여 두번째 과목은 영상인식시스템이라는 과목입니다. AI 쪽에서 VISION 쪽에 해당하는 과목입니다. 과목 난이도는 중급이라고 되어있지만 VISION을 전공한 저에게도 새로운 정보를 많이 알 수 있었습니다.( 그만큼 어려웠단 말 ) VISION을 전공하고 싶으시다면 저는 듣는 걸 진짜로 강추합니다. 하지만 VISION을 전공하지 않을건데, 궁금하다면... 도망치세요 일단 설명을 간단히 드리자면, 교수님이 정말 똑똑하십니다. 진짜로 많이 알고 있고 많은 정보를 전달해주십니다. 그만큼 잘 따라가야한다고 생각합니다. 교수님의 자체 강의안으로 수업을 진행하며, PPT에는 주로 어떤 기술에 대한 질문 -> 질문에 대한 해답을 알려주는 형태로 많이 진.. 2025. 6. 23.
DragonFly 다중 해상도 줌(확대)기능을 갖춘 Llama-3 기반 Vision Language Model 소개TogetherAI에서 공개한 Dragonfly는 Llama-3 기반의 새로운 비전-언어 아키텍처 모델로, 대규모 멀티모달 모델(LMM)의 발전을 기반으로 한 새로운 아키텍처이다. 고해상도 이미지가 시각적 세부 사항을 이해하는 데 중요한 역할을 하지만, 고해상도 입력은 언어 모델의 컨텍스트 길이를 연장시켜 비효율을 초래하고, 시각적 특성의 복잡성을 증가시켜 더 많은 훈련 데이터나 복잡한 아키텍처를 필요로 한다.이를 해결하기 위해 Dragonfly는 멀티 해상도 시각 인코딩과 줌인 패치 선택이라는 두 가지 주요 전략을 사용한다. 이러한 전략을 통해 모델은 고해상도 이미지를 효율적으로 처리하면서도 적절한 컨텍스트 길이를 유지할 수 있다. Dragonfly는 여덟 가지 인기 벤치마크에서 경쟁력 있는 성능을.. 2024. 6. 17.