Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

[20230129] Weekly AI ArXiv 만담 시즌2 - 3회차 #69

Open
jungwoo-ha opened this issue Jan 28, 2023 · 3 comments
Open

[20230129] Weekly AI ArXiv 만담 시즌2 - 3회차 #69

jungwoo-ha opened this issue Jan 28, 2023 · 3 comments

Comments

@jungwoo-ha
Copy link
Owner

jungwoo-ha commented Jan 28, 2023

News

ArXiv

  • DetectGPT: Zero-Shot Machine-Generated Text Detection using Probability Curvature

    • Stanford Univ. 에서 나온 GPT3 생성 문장 디텍팅 하는 방법 (Chris Manning & Chelsea Finn)
    • 입력문장 --> T5로 몇가지 표현 변경 여러개 --> Likelihood curvature 체크 --> 들쭉날쭉이면 사람 아니면 생성
    • davinci 급 모델이 아니어서 다소 아쉽긴 함 (likelihood를 찍어봐야하기 때문으로 보임)
    • 사람이 중간 수정을 하게 되면 디텍팅 정확도가 조금씩 감소함.
      image
      image
      image
  • MusicLM: Generating Music From Text

    • 논문은: https://arxiv.org/abs/2301.11325
    • Text Prompt 입력에 대하여 Music audio 생성하여 출력
    • 기본적으로 3가지 (SoundStream, w2v-BERT, MuLan) Pretrained 모델을 활용
    • Training 시에는 audio를 입력받아 MuLan token (audio) --> semantic token --> audio token
    • Inference 시에는 text prompt를 MuLan 입력으로 받아 동일한 과정 거쳐 audio token 만들어 SoundStream decoder로 음원생성
    • MusicCap 이란 데이터셋도 함께 공개
    • 저작권이나 표절관련 결과도 함께 (10초 프롬프트에 훈련데이터 정확하게 겹칠 확률은 0.1% 이내)
      image
      image
@veritas9872
Copy link

veritas9872 commented Jan 29, 2023

논문:
Sybil: A Validated Deep Learning Model to Predict Future Lung Cancer Risk From a Single Low-Dose Chest Computed Tomography

Paper: https://ascopubs.org/doi/10.1200/JCO.22.01345

MIT와 MGH에서 공동연구를 진행해 폐 결절의 악성도를 CT 영상에서 예측하는 모델을 만들어 최대 6년 후의 악성도 여부까지 예측한 논문이 Journal of Clinical Oncology (IF: 44.54) 게재되었습니다.

폐결절은 biopsy를 통해 악성 여부를 판단하기에 위험이 크기 때문에 CT 영상만으로 악성 여부를 판단하고자 하는 연구가 진행이 되고 있는데 기존 연구는 NLST 데이터셋을 기반으로 최대 2년까지만 예측을 할 수 있었던 반면에 해당 연구는 6년까지 예측을 했다는데 의의를 둘 수 있습니다.

데이터 준비 및 예시:
image

모델 구조:
image

연도별 malignancy (악성도) 예측에 대한 AUROC.
image

@nick-jhlee
Copy link

nick-jhlee commented Jan 29, 2023

News

Papers

@dhlee347
Copy link

  • Constitutional AI: Harmlessness from AI Feedback

    • 최근에 ChatGPT에 썼다고 해서 핫한 RLHF (LM의 응답들에 대한 사람의 선호도를 기반으로 언어모델 강화학습)
      image

    • Human Feedback으로는 Human Performance를 넘을 수 없다?!

    • 사람은 LM이 따라야할 헌법(constitution)을 만들고, AI가 스스로 응답이 이것들을 따르는지 판단하여 AI Feedback 생성

    • 기존 RLHF에서 helpfulness 방향과 harmlessness 방향이 충돌나는 것을 방지

      • 위험한 응답을 회피하여 harmlessness을 획득하면 helpfulness가 떨어짐. 이를 방지하는 것이 가능
      • 이번 work에서는 harmlessness에 대해서만 적용 (helpfulness는 기존대로 Human Preference Feedback 활용)
        image
    • (Supervised Stage) Critique → Revision → Supervised Learning

      • (사람이 미리 설정한) Critique Request와 Revision Request 원칙을 기반으로 자동으로 고쳐진 응답으로 재학습
      • critique-revision 과정 여러번 적용 (16 원칙에서 랜덤하게 추출한 원칙 적용)
      image image image
    • (RL Stage) AI Comparison Evaluations → Preference Model → Reinforcement Learning

      • LM의 두 응답 사이의 선호도를 Multiple Choice 형태의 Prompt로 LM에 물어봄
      • (A), (B) 사이의 log prob 비교로 AI Feedback 제공
      • 경우에 따라 Chain-of-Thought Prompting을 사용하기도 함.
      image
    • 결과
      image
      image
      image

    • 토론

      • Human Performance를 넘긴다는 포부는 좋았으나, 아직은 보다 쉬운 harmlessness 쪽으로만 적용
      • 향후에 LM끼리 Self-play를 해서 Alpha-Zero처럼 사람의 개입없이 자동으로 성능이 향상되는 것이 가능할 것인가?
  • RLHF 괴담?

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

4 participants