Tasks Modified

Actions

Tasks Modified

Actions

Loading...
Loading

new_tasks.yml

2,813 workflow runs

assistant prefill Tasks Modified #4025: Pull request #2615 synchronize by baberabb

January 15, 2025 20:55

1m 49s prefix

prefix

January 15, 2025 20:55

1m 49s

Add --examples Argument for Fine-Grained Task Evaluation in lm-evaluation-harness. This feature is the first step towards efficient multi-prompt evaluation with PromptEval [1,2] Tasks Modified #4023: Pull request #2520 synchronize by mirianfsilva

January 15, 2025 19:06

1m 53s mirianfsilva:examples-arg

mirianfsilva:examples-arg

January 15, 2025 19:06

1m 53s

Add MBPP (#2247) Tasks Modified #4022: Commit 5db23e2 pushed by baberabb

January 15, 2025 18:50

1m 44s main

main

January 15, 2025 18:50

1m 44s

Add MBPP Tasks Modified #4021: Pull request #2247 synchronize by baberabb

January 15, 2025 18:42

2m 7s hjlee1371:mbpp

hjlee1371:mbpp

January 15, 2025 18:42

2m 7s

Add HumanEval (#1992) Tasks Modified #4020: Commit 4c11206 pushed by baberabb

January 15, 2025 18:36

1m 49s main

main

January 15, 2025 18:36

1m 49s

Add HumanEval Tasks Modified #4019: Pull request #1992 synchronize by baberabb

January 15, 2025 18:23

1m 46s hjlee1371:humaneval

hjlee1371:humaneval

January 15, 2025 18:23

1m 46s

January 15, 2025 18:14

1m 31s mirianfsilva:examples-arg

mirianfsilva:examples-arg

January 15, 2025 18:14

1m 31s

Add HumanEval Tasks Modified #4017: Pull request #1992 synchronize by baberabb

January 15, 2025 18:13

1m 43s hjlee1371:humaneval

hjlee1371:humaneval

January 15, 2025 18:13

1m 43s

Add HumanEval Tasks Modified #4016: Pull request #1992 synchronize by baberabb

January 15, 2025 18:09

1m 42s hjlee1371:humaneval

hjlee1371:humaneval

January 15, 2025 18:09

1m 42s

Add MLQA Tasks Modified #4015: Pull request #2622 synchronize by KahnSvaer

January 15, 2025 17:13

3m 12s KahnSvaer:mlqa

KahnSvaer:mlqa

January 15, 2025 17:13

3m 12s

Add MLQA Tasks Modified #4012: Pull request #2622 synchronize by KahnSvaer

January 15, 2025 16:16

1m 36s KahnSvaer:mlqa

KahnSvaer:mlqa

January 15, 2025 16:16

1m 36s

Add MLQA Tasks Modified #4011: Pull request #2622 synchronize by KahnSvaer

January 15, 2025 06:24

1m 55s KahnSvaer:mlqa

KahnSvaer:mlqa

January 15, 2025 06:24

1m 55s

add hrm8k benchmark for both Korean and English Tasks Modified #4010: Pull request #2627 synchronize by bzantium

January 15, 2025 04:27

2m 18s feature/#2623

feature/#2623

January 15, 2025 04:27

2m 18s

add hrm8k benchmark for both Korean and English Tasks Modified #4009: Pull request #2627 opened by bzantium

January 15, 2025 04:24

2m 0s feature/#2623

feature/#2623

January 15, 2025 04:24

2m 0s

assistant prefill Tasks Modified #4008: Pull request #2615 synchronize by baberabb

January 14, 2025 23:05

7m 27s prefix

prefix

January 14, 2025 23:05

7m 27s

Add MLQA Tasks Modified #4007: Pull request #2622 synchronize by KahnSvaer

January 14, 2025 17:02

1m 55s KahnSvaer:mlqa

KahnSvaer:mlqa

January 14, 2025 17:02

1m 55s

January 14, 2025 16:58

2m 2s mirianfsilva:examples-arg

mirianfsilva:examples-arg

January 14, 2025 16:58

2m 2s

add hrm8k benchmark Tasks Modified #4005: Pull request #2624 opened by bzantium

January 14, 2025 12:35

2m 10s feature/#2623

feature/#2623

January 14, 2025 12:35

2m 10s

Add MLQA Tasks Modified #4004: Pull request #2622 opened by KahnSvaer

January 13, 2025 22:37

1m 44s KahnSvaer:mlqa

KahnSvaer:mlqa

January 13, 2025 22:37

1m 44s

fix: nemo eval in containers with TransformerEngine > 1.10 won't error Tasks Modified #4003: Pull request #2621 opened by terrykong

January 10, 2025 22:38

Action required terrykong:terryk/dist-ckpt-strictness-loosen

terrykong:terryk/dist-ckpt-strictness-loosen

January 10, 2025 22:38

Action required

Added EU20 task suite Tasks Modified #4002: Pull request #2620 opened by KlaudiaTH

January 10, 2025 13:04

18m 5s OpenGPTX:eu20_tasks

OpenGPTX:eu20_tasks

January 10, 2025 13:04

18m 5s

assistant prefill Tasks Modified #4001: Pull request #2615 synchronize by baberabb

January 9, 2025 18:45

11m 11s prefix

prefix

January 9, 2025 18:45

11m 11s

assistant prefill Tasks Modified #4000: Pull request #2615 synchronize by baberabb

January 8, 2025 18:44

6m 30s prefix

prefix

January 8, 2025 18:44

6m 30s

assistant prefill Tasks Modified #3999: Pull request #2615 synchronize by baberabb

January 8, 2025 17:22

8m 50s prefix

prefix

January 8, 2025 17:22

8m 50s

assistant prefill Tasks Modified #3998: Pull request #2615 synchronize by baberabb

January 8, 2025 17:21

4m 52s prefix

prefix

January 8, 2025 17:21

4m 52s

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Actions

Workflows

Management

Tasks Modified

Actions

Loading...
Loading

Create status badge

Filter by Event

Sorry, something went wrong.

Sorry, something went wrong.

No matching events.

Filter by Status

Sorry, something went wrong.

Sorry, something went wrong.

No matching statuses.

Filter by Branch

Sorry, something went wrong.

Sorry, something went wrong.

No matching branches.

Filter by Actor

Sorry, something went wrong.

Sorry, something went wrong.

No matching users.

Actions: EleutherAI/lm-evaluation-harness

Actions

Tasks Modified Tasks Modified Actions Loading... Loading Sorry, something went wrong.

Tasks Modified

Tasks Modified

Actions

Loading...
Loading