survey 5

Vision-Language Models for Vision Tasks: A Survey

Abstract vision recognition 연구 = DNN에 있는 crowd labeled data에 의존-> 힘들고 시간 소모 많음 zero shot 예측이 가능하고 web scale image-text pair로 vision-language 상관관계를 학습하는 Vision-Language Model(VLM)을 제시   Introductionmachine learning에서 deep learning으로 변하면서 두가지 문제 발생-> 1. DNN의 느린 수렴     2. large-scale, task-specific, crowd-labeled data의 힘든 수집 pretraining, fine tuning, prediction은 visual recognition task에서 효과적이였음DNN ..

survey 2024.09.11

A Review of Deep Learning-Based Semantic Segmentation for Point Cloud

Abstract3D scene을 이해하는 것으로 주요 단계로서 point cloud의 semantic segmentation은 주목을 받고 있다.간접 세분화에서 직접 세분화까지 다양한 측면을 다루는 survey를 제공한다.point 순서를 포함하는 다른 관점, multi scale, feature fusion, graph convolutional neural network(GCNN)의 fusion으로부터 직접적인 segmentation 방법뿐만 아니라 multi view, voxel grid에 기반된 간접적인 segmentation의 방법을 review한다.point cloud segmentation에 대한 일반적인 dataset은 연구자가 task에 대해 가장 적합한 것을 고르게 도와준다.  Intro..

survey 2024.07.02

Image Segmentation Using Deep Learning: A Survey

Abstractimage segmentation은 image processing과 computer vision에 주요 topic이다.ex) scene understanding, medical image analysis, robotic perception, video surveillance, augmented reality  Introductionimage segmention는 많은 segment나 object로 image를 분할하는 것이다. 과거의 image segmentation approach1. thresholding2. histogram-based bundling3. region growing4. k-means clustering5. watersheds6. active contours7. grap..

survey 2024.06.24

A Survey of Deep Learning Techniques for Autonomous Driving

Abstract이 논문의 목적성은 autonomous driving에 사용되는 deep learning 기술인 현재 sota를 조사하는 것이다.AI에 기반된 self driving architecture, cnn, rnn뿐만 아니라 강화학습까지 소개한다.이 방법론은 조사된 driving scene perception, path planning, behavior arbitation, motion control 알고리즘에 대한 기초로구성한다.각 module이 조종 명령에 sensory 정보를 직접 mapping하는 End2End 시스템뿐만 아니라 deep learning 방법을 사용해서 만든 modular perception, planning action pipeline 둘 다 조사한다.추가적으로,..

survey 2024.04.24

A survey: object detection methodsfrom CNN to transformer

Abstract Alexnet 이후에 CNN에 기반된 방법은 computer vision 분야에 주요 방법이 되었다. 빠르고 정확한 detection 효과를 가지기 위해서, CNN framework를 뛰어넘는 것은 필수적이고 큰 도전이다. transformer의 방법은 computer vision task에 사용할 수 있는 것을 증명했고, CNN 방법을 능가한다. computer vision task에 Transformer를 사용하는 최근 혁신적인 방법을 제시 Introduction object detection의 task와 목표는 직사각형의 bounding box를 가지는 주어진 image에 있는 object category와 위치를 올바르게 분류하는 것이다. 1. 전통적인 object detectio..

survey 2024.03.28