Home okdaltoPosts

김성현

@okdalto

Computer Graphics Researcher
Followers
4,211
Following
657
Account Insight
Score
31.18%
Index
Health Rate
%
Users Ratio
6:1
Weeks posts
좋은 기회로 '디자인코리아 2024'에서 '뉴럴 네트워크'라는 이름으로 전시를 진행했습니다. 일전에 CVPR 아트 갤러리에서 전시했던 작업을 좀 더 업그레이드한 버전입니다. 작업 과정과 모든 코드는 제 블로그에 올려두었습니다. 오픈 소스! 도움 주신 분들, 방문해주신 모든 분들 정말 감사드립니다! 😁 이 작업은 Processing( @processingorg )으로 제작되었습니다. - I had the great opportunity to exhibit at "Design Korea 2024" under the name "Neural Network." The entire process and all the code are available on my blog—open source! A huge thank you to everyone who supported me and visited the exhibition! This project was created using Processing (@processingorg ). #디자인코리아2024 #deeplearning #processing
643 11
1 year ago
부처님 오신날 기념 ComfyUI + Claude Code 워크숍을 엽니다. 이번 워크숍은 AAD @aad.art_ 와 함께 진행합니다. ComfyUI를 이미 사용해본 분들을 대상으로, Claude Code를 통해 API로 ComfyUI를 제어하는 방법을 함께 다룹니다. 일시 5월 24일 오후 2시~5시 장소 아터테인 2층 AAD 서울 서대문구 홍연길 63-4 대상 ComfyUI를 사용해본 경험이 있는 분 자세한 내용은 프로필 링크를 참고하세요.
84 5
5 days ago
🚨 Claude Code + ComfyUI 클래스 오픈! 요즘 조용히 갈리는 중입니다. 이미 편하게 하는 사람들 vs 아직도 손으로 하는 사람들 겉으로는 다 비슷해 보이는데, 속도 차이 슬슬 벌어지고 있습니다. - 워크플로를 “직접 만드는 사람” → “AI한테 시키는 사람”으로 전환 - 어차피 다 일일히 검수해야 하는 반복 작업 자동화! - 속 터지는 환경설정 자동화! 👉 안 쓰는 사람만 계속 검색하고 있습니다 🎁 모든 수강생에게 드리는 혜택 - 수업 때는 잘 돌아갔는데 집에서는 안 돌아가는 워크플로 제공! - 실무에 전혀 도움 안 되는 이론적 설명 다수 제공! - 이해한 것 같은 느낌 제공! - 좀 더 앞서가는 듯한 안심 제공! 👤 실무를 아는 진짜 전문가에게 배우세요! - 국가공인 포토샵 GTQ 1급 자격증 보유 - Driving License 1종 보통 - 카이스트 박사(과정) - 국제 학술대회 및 저널 논문 집필 다수 👥 이런 분들께 추천드립니다 - API가 뭔지 모르는 분 - 서버/클라이언트 개념이 낯선 분 - FOMO 오지게 유발하는 강좌 플랫폼에서 30만원 결제 직전인 분 - 엔비디아 주주 (평단가 높을수록 우선순위) - 주말에 더 나은 할 일이 별로 없는 분 💸 참가비 장소 대여비 n빵 (2만원, 학생 1만 5천원, 110-339-926031 신한 김성현) ⏳ 선착순 11명 마감 📍 장소 / 일정: 4월 25일 토요일 오후 2시~5시, 📍서울 성동구 성수일로 99 10층, 1004호 (공간더와이랩) 이미 하는 사람들은 더 이상 “어떻게 하지?” 고민 안 합니다. 아직 안 하는 사람만 계속 방법 찾고 있습니다 🙂
96 12
27 days ago
모든 가능성의 공간에서 서로의 손을 잡기 매 턴 150개의 자세를 탐색하고, softmax로 확률을 매기고, 가장 밝은 하나를 고르는 비효율적이며 아름다운 IK 시스템. #generativeart #digitalart #networkvisualization #algorithmicart #creativecoding
93 0
1 month ago
노드들이 공간 안에서 서로 밀고 당기면서 자리를 잡고, 가까운 노드끼리 자동으로 엣지가 연결된다. 엣지는 두 노드 사이를 연결하는 흐름량에 따라 두꺼워지거나 얇아지고, 유지할 수 없는 연결은 늘어나다 끊어진다. 두꺼운 줄은 묵직하게, 얇은 줄은 가볍게. 주기적으로 노드 위치가 리셋되면서 기존 구조가 한꺼번에 무너지고 새로운 연결이 처음부터 다시 형성된다. #generativeart #digitalart #networkvisualization #algorithmicart #creativecoding
139 3
1 month ago
장원영이 되는 주파수 장원영 되는 주파수를 보고 문득 푸리에 변환이 생각났다. 푸리에 변환은 어떤 신호든 사인과 코사인의 합, 즉 다양한 주파수 성분으로 분해할 수 있게 해준다. 이 개념을 2차원으로 확장하면, 각각의 주파수 성분은 하나의 원운동으로 이해할 수 있다. 여러 개의 원운동이 중첩되면서 하나의 형상이 만들어지는 것. 그래서 나는 장원영의 사진을 커브 데이터로 변환한 뒤, 그 곡선에 Discrete Fourier Transform을 적용했다. 그 결과 얻어진 주파수 성분들을 각각의 원운동으로 시각화했고, 사인과 코사인의 합이 다시 장원영의 형상을 만들어내는 과정을 구현했다. 말 그대로 장원영이 되는 주파수를 만든 셈. 사운드 역시 이 DFT 주파수 값들을 그대로 사용해 제작했다. 다만 모든 성분을 한꺼번에 재생하는 대신, 그리기가 진행되는 순서에 맞춰 성분을 하나씩 더해가며 소리를 쌓았다. 처음엔 가장 지배적인 주파수 하나가 단순한 톤으로 울리고, 형상이 완성되는 순간 수백 개의 성분이 모두 합쳐진 화음이 된다. 왜 이런 짓을 하냐구요? 할 수 있으니까... #장원영 #주파수 #FourierTransform #DFT #GenerativeArt
198 11
2 months ago
Z-Image latent space visualization Z-Image 잠재 공간 시각화 Z-Image의 latent space에 PCA를 적용해 고차원 생성 경로를 3차원으로 투영하여, 100개의 이미지 생성 과정을 시각화했다. Z-Image는 rectified flow 기반 모델이라, 노이즈에서 이미지까지의 경로가 거의 직선에 가깝다. 고차원 공간에서 직선인 경로는 저차원으로 사영해도 직선으로 나타나기 때문에, PCA로 차원을 줄여도 이 직선성이 거의 그대로 보존되는 것을 확인할 수 있다. 각 가지는 서로 다른 프롬프트의 생성 경로이며, 하나의 노이즈에서 출발해 각각의 이미지로 뻗어나가는 흐름을 볼 수 있다. 모든 것은 OpenGL로 구현. #zimage #generativeai #latentspace #opengl #aiart
258 6
2 months ago
해저탐험 Gaussian Splatting 엔진을 만들고, Perspective Matrix와 Radix Sort에 여러가지 변형을 줘서 기묘한 시각효과를 만들었다. 카메라가 자동으로 경로를 만들게 하고 싶어서, BVH로 스플랫이 가득 차 있는 공간을 구하고, 그걸 피해서 가는 경로를 3차원 A*알고리즘으로 구했다. #GaussianSplatting #GenerativeArt #MediaArt #CreativeCoding #realtime
111 1
2 months ago
Visualizing how GPT actually works. GPT의 작동 원리 시각화. 여러분이 사용하는 언어 모델은 대체로 이런 구조 위에서 작동합니다. Transformer Encoder를 시각화한 이전 작업에 이어서 아예 단순한 형태의 GPT를 구현해보았다. 학습 데이터로는 4만 줄 분량의 셰익스피어 희곡을 담은 Tiny Shakespeare 데이터셋을 사용함. PyTorch와 같은 딥러닝 프레임워크 없이 forward 및 backward pass까지 모든 것을 NumPy로 스크래치부터 구현하고, OpenGL로 시각화했다. 미리 계산된 값을 사용하는 게 아니라 모든 과정이 실시간으로 연산된다는 것도 중요한 포인트. 오디오도 마찬가지로 NumPy로 구현되었다. 단 한 줄의 코드도 직접 작성하지 않았다. 모든 코드는 Claude Code로 작성. 직접 만져보고 싶은 분들은 모든 코드를 깃헙에 올려두었으니 그쪽을 참고하시길! #transformer #gpt #opengl #deeplearning #creativecoding
148 4
2 months ago
Transformer encoder block의 내부 동작 시각화. QKV Projection부터 Multi-Head Attention, Feed-Forward까지 모든 행렬 연산을 단계별 애니메이션으로 표현했다. 각 큐브는 행렬의 원소 하나를 나타낸다. (파란색 = 음수, 빨간색 = 양수). Python + OpenGL로 구현했으며, 리얼타임으로 작동한다. 깃헙에 모든 코드를 올려놨으니 원하는 분은 직접 돌려보시길! 참고로, 단 한 줄의 코드도 직접 작성하지 않았다. 사운드 포함 모든 코드는 전부 AI로 작성. #transformer #deeplearning #realtime #opengl #visualization
165 3
3 months ago
autoregressive transformer를 이용한 시각적 실험. 막스 쿠퍼 공연을 보고 창작욕이 끓어올라 지난번 작업을 3차원으로 확장해봤다. GPT 기반 autoregressive transformer가 4096-토큰 VQGAN 코드북 위의 이산 잠재 공간을 샘플링한다. 32x32x32 격자를 DFS로 순회하며, 매 스텝마다 트랜스포머가 다음 토큰을 추론한다. 생성된 토큰은 VQGAN 디코더를 통해 8x8 픽셀 패치로 복원되어 256x256x32 볼륨을 채운다. 전체 순회가 끝나면 각 Z-슬라이스를 32x32 토큰 그리드 단위로 VQGAN에 재통과시켜, 인접 토큰 간 공간적 일관성이 반영된 실제 이미지 32장이 Z축으로 적층된 3차원 볼륨이 완성된다. 이를 단일 산란 모델 기반 GLSL ray marching으로 실시간 렌더링하고, KV 캐시 내 토큰 간 어텐션 가중치를 베지에 커브로 시각화한다. #MediaArt #GenerativeArt #CreativeCoding #GLSL #Raymarching
333 14
3 months ago
이미지를 토큰으로 바꿔서 autoregressive하게 다음 토큰 예측하기... 인데 깊이 우선 탐색(DFS)을 곁들인. 새로운 표현 탐색의 일환. 얼굴 이미지로 학습했는데 다 깨져버리는 것이 재미있는 효과를 준다.
167 7
3 months ago