본문 바로가기
반응형

분류 전체보기9

[논문리뷰] Fractal Generative Models Fractal Generative ModelsModularization is a cornerstone of computer science, abstracting complex functions into atomic building blocks. In this paper, we introduce a new level of modularization by abstracting generative models into atomic generative modules. Analogous to fractalsarxiv.org한국 시간으로 25일에 최초로 나온 따끈따끈한 논문을 들고 왔다. 웬만하면 이런 짧은 제목의 논문은 잘 보지 않는 편인데, MASK R-CNN, ResNet, Focal Loss, FPN 등의 .. 2025. 2. 26.
[Paper Review] StyleGAN : A Style-Based Generator Architecture for Generative Adversarial Networks A Style-Based Generator Architecture for Generative Adversarial NetworksWe propose an alternative generator architecture for generative adversarial networks, borrowing from style transfer literature. The new architecture leads to an automatically learned, unsupervised separation of high-level attributes (e.g., pose and identitarxiv.org* 이 논문 리뷰는 StyleGAN 시리즈 논문에 대한 세미나를 준비하면서 작성된 글이기에, 다소 얕고 주인장.. 2025. 2. 25.
[Paper Review] DeepSeek-R1 : Incentivizing Reasoning Capability in LLMs via Reinforcement Learning DeepSeek에서 또 새로운 사고를 쳤다. 기존 deepseek-v3만 해도 충분히 파라미터 대비 성능이 잘 나온다고 해서 말이 상당히 많은 상태였는데, 이제는 더 작은 파라미터로 o1과 거의 비슷하거나 그 이상의 성능을 내버리는 모델이 나오고 말았다. 일단 논문을 보고 올거라면 아래의 논문을 보기를 바란다. DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement LearningWe introduce our first-generation reasoning models, DeepSeek-R1-Zero and DeepSeek-R1. DeepSeek-R1-Zero, a model trained via large-scale reinf.. 2025. 1. 29.
반응형