The BigScience ROOTS Corpus: A 1.6TB Composite Multilingual Dataset
- Laurençon, H.
- Saulnier, L.
- Wang, T.
- Akiki, C.
- del Moral, A.V.
- Le Scao, T.
- von Werra, L.
- Mou, C.
- Ponferrada, E.G.
- Nguyen, H.
- Frohberg, J.
- Šaško, M.
- Lhoest, Q.
- McMillan-Major, A.
- Dupont, G.
- Biderman, S.
- Rogers, A.
- Ben allal, L.
- De Toni, F.
- Pistilli, G.
- Nguyen, O.
- Nikpoor, S.
- Masoud, M.
- Colombo, P.
- de la Rosa, J.
- Villegas, P.
- Thrush, T.
- Longpre, S.
- Nagel, S.
- Weber, L.
- Muñoz, M.R.
- Zhu, J.
- van Strien, D.
- Alyafeai, Z.
- Almubarak, K.
- Chien, V.M.
- Gonzalez-Dios, I.
- Soroa, A.
- Lo, K.
- Dey, M.
- Suarez, P.O.
- Gokaslan, A.
- Bose, S.
- Adelani, D.I.
- Phan, L.
- Tran, H.
- Yu, I.
- Pai, S.
- Chim, J.
- Lepercq, V.
- Ilić, S.
- Mitchell, M.
- Luccioni, S.
- Jernite, Y.
- Mostrar todos los/as autores/as +
ISSN: 1049-5258
ISBN: 9781713871088
Año de publicación: 2022
Volumen: 35
Tipo: Aportación congreso