A Stronger Mixture of Low-Rank Experts for Fine-Tuning Foundation Models

Source code of paper: A Stronger Mixture of Low-Rank Experts for Fine-Tuning Foundation Models.

Install

Clone this repository

git clone https://github.com/THUDM/MoELoRA_Riemannian.git

Install dependencies

conda create -n moelora_riemannian python=3.10 -y
conda activate moelora_riemannian
pip install -r requirements.txt

Prepare ScienceQA Data (for example)

Prepare the datasets by this script:

python prepare_data.py \
  --save_path "./dataset/scienceqa"

Organize your datasets in the following structure:

MoELoRA_Riemannian/dataset/
├── scienceqa/
│   ├── science_qa.hf
│   ├── scienceqa_train.json
│   ├── scienceqa_test.json
│   └── ...
└── ...

How to Run

# CUDA_VISIBLE_DEVICES=[GPU ID] python -m torch.distributed.launch --nproc_per_node 1 [TRAINING_SCRIPT] [DATASET] [OPTIMIZER] [METHOD]

# train MoE-LoRA with per-expert classic Riemannian preconditioners (the SGD optimizer)
CUDA_VISIBLE_DEVICES=0 python -m torch.distributed.launch --nproc_per_node 1 train_llama.py ScienceQA sgd riemannian

# train MoE-LoRA with per-expert classic Riemannian preconditioners (the AdamW optimizer)
CUDA_VISIBLE_DEVICES=0 python -m torch.distributed.launch --nproc_per_node 1 train_llama.py ScienceQA adamw riemannian

# train MoE-LoRA with our method (the SGD optimizer)
CUDA_VISIBLE_DEVICES=0 python -m torch.distributed.launch --nproc_per_node 1 train_llama.py ScienceQA sgd ourmethod

# train MoE-LoRA with our method (the AdamW optimizer)
CUDA_VISIBLE_DEVICES=0 python -m torch.distributed.launch --nproc_per_node 1 train_llama.py ScienceQA adamw ourmethod

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
README.md		README.md
custom_optimizer.py		custom_optimizer.py
dataset.py		dataset.py
moe_lora.py		moe_lora.py
prepare_data.py		prepare_data.py
requirements.txt		requirements.txt
train_glm.py		train_glm.py
train_llama.py		train_llama.py
train_llava.py		train_llava.py
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

A Stronger Mixture of Low-Rank Experts for Fine-Tuning Foundation Models

Install

Prepare ScienceQA Data (for example)

How to Run

About

Releases

Packages

Contributors 2

Languages

THUDM/MoELoRA_Riemannian

Folders and files

Latest commit

History

Repository files navigation

A Stronger Mixture of Low-Rank Experts for Fine-Tuning Foundation Models

Install

Prepare ScienceQA Data (for example)

How to Run

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages