의존성에 LLM 생성 코드 금지

4 hours ago 3
  • git-annex는 LLM 생성 코드가 포함된 의존성 없이 빌드되도록 지난 한 달간 약 100시간을 들여 점검됨
  • 이 작업은 개별 코드보다 전체 의존성 트리를 계속 추적해야 하는 현실을 드러내며, 유지보수 부담을 크게 키움
  • 점검 중에는 대규모 LLM 생성 변경의 무설명 되돌림, 26,000 LOC 코드베이스의 10,000줄 변경, 1,489줄짜리 일관성 없는 커밋 메시지 같은 사례가 확인됨
  • 의존성의 품질 정보를 추가로 얻은 점은 긍정적이지만, Software Freedom Conservancy나 FSF 같은 조직 차원의 대응에는 회의적인 시각이 남아 있음
  • LLM으로 설정 추가나 포맷팅 변경을 쉽게 만들 수 있어도, 그런 커밋은 협업 신뢰와 프로젝트 참여에 직접적인 비용을 만들 수 있음

git-annex 의존성 점검

  • git-annex는 LLM 생성 코드를 포함한 의존성 없이 빌드되도록 약 한 달 동안 약 100시간을 투입해 점검함
  • 현재까지는 목표를 달성한 상태로 보임
  • 관련 페이지로 git-annex no LLM code가 있음
  • 문제의 핵심은 프로그램의 전체 의존성 트리를 계속 검토해야 하는 부담에 있음

점검 중 드러난 사례와 영향

  • 확인된 사례들은 단순한 취향 문제가 아니라 유지보수와 신뢰의 문제로 이어짐
    • 큰 규모의 LLM 생성 변경이 다음 릴리스에서 아무 설명 없이 되돌려짐
    • 26,000 LOC 코드베이스에 10,000줄 변경이 들어갔고, 커밋 메시지는 1,489줄의 일관성 없는 내용이었음
    • 다른 프로젝트에서 코드를 복사하라는 LLM 프롬프트가 있었고, 운 좋게 저작권 침해를 피한 것처럼 보였음
  • 이번 작업으로 의존성의 품질에 대한 추가 정보를 얻었고, 이 정보는 앞으로의 선택에 영향을 줄 수 있음
  • Software Freedom Conservancy는 LLM 기반 생성 AI 권고에서 해당 문제를 넘긴 것처럼 보이며, FSF가 더 잘할지도 불확실함
  • 이런 변화 속에서 관련 커뮤니티 참여를 재고하고 있지만, 작업과 사용자 지원은 계속함
  • LLM에 Add fourmolu config and restyled, neat, format a module 같은 프롬프트를 주고 결과를 커밋하는 방식은 쉬워 보일 수 있으나, 그 행동의 광범위한 영향을 고려해야 함
Read Entire Article