
[GPU] FlashAttention2 설치 오류로 Qwen 모델 로딩 실패 해결
FlashAttention2 설치 문제로 인해 Qwen 모델 로딩에 실패하는 오류를 CUDA 버전 업그레이드(11.5 → 12.6)로 해결한 과정을 정리합니다.

FlashAttention2 설치 문제로 인해 Qwen 모델 로딩에 실패하는 오류를 CUDA 버전 업그레이드(11.5 → 12.6)로 해결한 과정을 정리합니다.
Docker Root Directory(`/var/lib/docker`)를 NAS 등 다른 디렉토리로 변경하는 방법과, 발생할 수 있는 오류(troubleshooting) 및 systemd override 활용법을 정리합니다.
git ssh 설정하는 방법에 대해 작성합니다. ssh 키에 패스 프레이즈 없이 생성하는 방법 키 생성 (base) ubuntu@a100-80g-4:~/.ssh$ ssh-keygen -t ed25519 -f ~/.ssh/joeun2ce -C "joeun2ce@gmail.com" Generating public/private ed25519 key ...
A100 80GB 서버에서 하나의 PID가 여러 GPU에 중복 표기되는 현상을 원인 분석(MIG 비활성화, 자원 격리 부재)과 MIG 구성 절차로 해결한 사례 정리.
GitHub Actions 워크플로우에서 GitHub App 인증을 활용해 다른 Repository의 Release Asset을 안전하게 다운로드하는 방법을 정리합니다.
Conda 환경에서 불필요한 패키지를 제외하고 실제 사용 중인 라이브러리만 추출해 requirements.txt를 생성하는 방법을 pipreqs로 정리합니다.
Git에서 main 브랜치의 최신 내용을 dev 브랜치로 가져오는 방법을 merge, rebase, pull 세 가지 방식으로 정리합니다.
Docker와 PyInstaller를 활용해 macOS 환경에서 Windows 실행파일(.exe)을 cross-build하고 자동화하는 방법을 정리합니다.
Django ORM의 select_related, prefetch_related 사용법과 Django REST Framework Serializer, GenericAPIView, Mixins를 활용한 API 개발 방법을 정리합니다.
Spring Data JPA에서 @Transactional 누락으로 발생하는 'No EntityManager with actual transaction available for current thread' 오류 해결 방법을 다룹니다.