new task: pointer network for joint ner and re #10

ArneBinder · 2023-11-29T15:45:44Z

code is mostly taken from https://github.com/ArneBinder/pie-document-level/pull/26

Note: This adds the requirement transformers = "^4.32.0", so that we can import BartPreTrainedModel (breaking).

Requires:

pytorch-ie>=0.29.5 (add TaskModule.configure_model_metric(stage) pytorch-ie#392)
new task: text-2-text #24 (for the PIE model)
re-arrange and add taskmodule metrics #25 (for metrics)
add BartModelWithDecoderPositionIds base model #26 (for decoder_position_id_pattern, i.e. replaced positional encodings (RPE))

TODO:

Follow-up:

adapt other base models, see transformers.AutoModelForSeq2SeqLM for candidates
- e.g. LongT5ForConditionalGeneration (pszemraj/long-t5-tglobal-base-sci-simplify)
maybe: use BucketSampler, see Allowed custom BatchSamplers when instantiated in *_dataloader hook Lightning-AI/pytorch-lightning#13640 (comment)

codecov-commenter · 2023-11-29T15:47:43Z

Codecov Report

Attention: 43 lines in your changes are missing coverage. Please review.

Comparison is base (7198a39) 95.64% compared to head (b79aa68) 95.56%.

Files	Patch %	Lines
...ules/taskmodules/pointer_network_for_end2end_re.py	93.58%	25 Missing ⚠️
...ules/models/base_models/bart_as_pointer_network.py	93.42%	10 Missing ⚠️
src/pie_modules/models/components/pointer_head.py	97.65%	3 Missing ⚠️
...ules/pointer_network/annotation_encoder_decoder.py	97.98%	3 Missing ⚠️
src/pie_modules/taskmodules/common/interfaces.py	88.88%	2 Missing ⚠️

Additional details and impacted files

@@            Coverage Diff             @@
##             main      #10      +/-   ##
==========================================
- Coverage   95.64%   95.56%   -0.09%     
==========================================
  Files          34       40       +6     
  Lines        2459     3315     +856     
==========================================
+ Hits         2352     3168     +816     
- Misses        107      147      +40

☔ View full report in Codecov by Sentry.
📢 Have feedback on the report? Share it here.

ArneBinder · 2023-12-19T13:24:36Z

It looks like the training is now aligned. When we replace the weights of the original model with the ones from the simple model, we get the following:

# check the numbers
assert {layer_name: len(anns) for layer_name, anns in fp.items()} == {
    "labeled_spans": 101,
    "binary_relations": 63,
}
assert {layer_name: len(anns) for layer_name, anns in fn.items()} == {
    "labeled_spans": 93,
    "binary_relations": 73,
}
assert {layer_name: len(anns) for layer_name, anns in tp.items()} == {
    "labeled_spans": 41,
    "binary_relations": 9,
}

which is quite close to the result from the not-modified original model:

# check the numbers
assert {layer_name: len(anns) for layer_name, anns in fp.items()} == {
    "labeled_spans": 126,
    "binary_relations": 72,
}
assert {layer_name: len(anns) for layer_name, anns in fn.items()} == {
    "labeled_spans": 88,
    "binary_relations": 73,
}
assert {layer_name: len(anns) for layer_name, anns in tp.items()} == {
    "labeled_spans": 46,
    "binary_relations": 9,
}

The result for the simple model we took the weights from is much worse:

# check the numbers
assert {layer_name: len(anns) for layer_name, anns in fp.items()} == {
    "labeled_spans": 108,
    "binary_relations": 65,
}
assert {layer_name: len(anns) for layer_name, anns in fn.items()} == {
    "labeled_spans": 106,
    "binary_relations": 78,
}
assert {layer_name: len(anns) for layer_name, anns in tp.items()} == {
    "labeled_spans": 29,
    "binary_relations": 4,
}

…ing()

…d with special ids (bos, eos, pad) and number of target_token_ids; fix PointerHead.forward() for non default eos_id / label_ids

…e_decoder_input_ids(), and prepare_decoder_position_ids(); add pad_input_id to prepare_decoder_input_ids() instead

…rrectly parametrize

…re data

ArneBinder added new taskmodule new model labels Nov 29, 2023

ArneBinder force-pushed the pointer_network_joint_ner_and_re branch 4 times, most recently from 0e5c6f6 to 4efc78d Compare December 11, 2023 19:23

ArneBinder mentioned this pull request Dec 12, 2023

use HF generate for pointer network #20

Closed

9 tasks

ArneBinder added the breaking Breaking Changes label Dec 13, 2023

ArneBinder force-pushed the pointer_network_joint_ner_and_re branch 2 times, most recently from a9b37db to 2261afc Compare December 22, 2023 14:23

ArneBinder mentioned this pull request Dec 28, 2023

new task: text-2-text #24

Merged

10 tasks

ArneBinder force-pushed the pointer_network_joint_ner_and_re branch 3 times, most recently from 6b03d46 to 1d5dee1 Compare January 8, 2024 12:05

ArneBinder added 14 commits January 8, 2024 13:40

move source files

d87d8b6

fix name

5d21ad8

add comments

b5c18e5

add BartAsPointerNetwork.overwrite_decoder_label_embeddings_with_mapp…

80ee064

…ing()

make pre-commit happy

4c013cb

add SimplePointerNetworkModel

41b8c81

add metrics to SimplePointerNetworkModel

748b0cd

rearrange tests (and skip test_bart_generate)

3e41638

raise a exception if decoder_input_ids are missing

4fb1c1b

fiy predict

4762a6c

add tests for SimplePointerNetworkModel

8c2078f

test_bart_pointer_network_generate_with_scores()

9030458

fix configure_optimizers() and add tests

c1ab42a

remove lm_head

edf514e

ArneBinder added 27 commits January 8, 2024 17:06

streamline position ids configuration

d9db9cf

improve comments

e49250a

remove max_target_positions from BartAsPointerNetworkConfig

23fce44

remove output_size from PointerHead because it was not used; add todo

82aea3f

add some tests for PointerHead

1503f0e

add bos_ids to PointerHead, but remove label_ids (can be reconstructe…

bdc071e

…d with special ids (bos, eos, pad) and number of target_token_ids; fix PointerHead.forward() for non default eos_id / label_ids

improve and add tests for PointerHead

324df70

rearrange

bb35130

add argument names

8faaefa

add and re-arrange tests for BartAsPointerNetwork

af32a62

add todo

e9c2155

greatly simplify BartAsPointerNetwork

43d287d

add test_configure_optimizer()

6ac4f3a

improve todo

458b57e

remove todo

418e8fa

cleanup

4941c91

remove todo (moved to PR description)

1b83d29

remove test_simple_generative_pointer.py

286714e

remove attention_mask parameter from prepare_decoder_inputs(), prepar…

6c662db

…e_decoder_input_ids(), and prepare_decoder_position_ids(); add pad_input_id to prepare_decoder_input_ids() instead

handle deprecation warning (assert_allclose)

3683874

mask bos positions (in addition to eos and pad) on pointer scores; co…

39974de

…rrectly parametrize

improve test cases

a145fe0

use sshleifer/bart-tiny-random to test BartAsPointerNetwork

865f9b5

remove test_simple_generative_pointer_predict.py and respective fixtu…

9a0ade6

…re data

do not show precision / recall / f1 in percent

ec1ebaa

revert: mask bos token offsets

3dddc17

minor change

b79aa68

ArneBinder merged commit 59d8aaa into main Jan 11, 2024
2 checks passed

ArneBinder deleted the pointer_network_joint_ner_and_re branch January 11, 2024 12:15

ArneBinder mentioned this pull request Jan 19, 2024

Original pointer network [DON'T MERGE] #23

Closed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

new task: pointer network for joint ner and re #10

new task: pointer network for joint ner and re #10

ArneBinder commented Nov 29, 2023 •

edited

Loading

codecov-commenter commented Nov 29, 2023 •

edited

Loading

ArneBinder commented Dec 19, 2023 •

edited

Loading

new task: pointer network for joint ner and re #10

new task: pointer network for joint ner and re #10

Conversation

ArneBinder commented Nov 29, 2023 • edited Loading

codecov-commenter commented Nov 29, 2023 • edited Loading

Codecov Report

ArneBinder commented Dec 19, 2023 • edited Loading

ArneBinder commented Nov 29, 2023 •

edited

Loading

codecov-commenter commented Nov 29, 2023 •

edited

Loading

ArneBinder commented Dec 19, 2023 •

edited

Loading