Ábhar ‘The Irish Times’ curtha le Gaois.ie agus 13.5 milliún focal i gCorpas na Gaeilge Comhaimseartha

Is féidir minicíocht focal agus frásaí i nGaeilge na linne seo a mheas go réasúnta cruinn leis an uirlis shimplí chuardaigh ar an suíomh

Ábhar ‘The Irish Times’ curtha le Gaois.ie agus 13.5 milliún focal i gCorpas na Gaeilge Comhaimseartha

Tá ábhar Gaeilge an nuachtáin The Irish Times anois ar fáil i gCorpas na Gaeilge Comhaimseartha ar an suíomh Gaois.ie. Fágann sé sin go bhfuil 13.5 milliún focal sa chorpas.

Is éard atá i gceist leis an gCorpas ná bailiúchán aonteangach téacsanna Gaeilge a foilsíodh ó thús an chéid seo i leith. Tá ábhar ó shuíomhanna atá beo faoi láthair, leithéidí Tuairisc.ie, Nós.ie agus Nuacht RTÉ, agus ó shuíomhanna nach bhfuil ag feidhmiú níos mó, leithéidí Beo! Tá samplaí ó chartlanna na bhfoilsitheoirí Cló Iar-Chonnacht agus Cois Life ar fáil sa chorpas freisin chomh maith le samplaí ó fhoilseacháin, leithéidí Comhar agus Seachtain.

Tá an corpas seo in úsáid mar acmhainn inmheánach téarmeolaíochta ag Fiontar agus Scoil na Gaeilge le tamall ach tugadh rochtain saor in aisce don phobal air anuraidh. Ó seoladh an suíomh poiblí i mí Aibreáin seo caite, cuireadh ábhar ó na hirisí Feasta agus An tUltach chomh maith leis an suíomh Meon Eile leis.

Tá sé i gceist ag Fiontar cur le hábhar agus le feidhmiúlacht an chorpais de réir a chéile agus súil acu cloisteáil “ó shealbhóirí cóipchirt eile a bhfuil ábhar digiteach Gaeilge acu atá ag teacht le scóip an chorpais”.

Is féidir minicíocht focal agus frásaí i nGaeilge na linne seo a mheas go réasúnta cruinn leis an uirlis shimplí chuardaigh ar an suíomh.

Is léir, mar shampla, gur coitianta i bhfad an focal Béarla ‘Brexit’ in ábhar scríofa na Gaeilge ná na leaganacha Gaeilge a moladh ó tosaíodh ag caint ar imeacht na Breataine ón Aontas Eorpach cúpla bliain ó shin. Tá 222 tagairt don leagan Béarla sa chorpas le hais an 74 tagairt do ‘Breatimeacht’ agus an 14 tagairt do ‘Sasamach’.

Is ag an bhfocal ‘giolc’ (126 tagairt) atá an lámh in uachtar ar leagan oifigiúil Twitter ‘tweet’ (71 tagairt) agus leagan oifigiúil an Choiste Téarmaíochta ‘tvuít’ (44).

Ag tús an chéid bhí díospóireacht mhór ann faoi cé acu ‘fón póca’, ‘fón móibíleach’ nó ‘fón soghluaiste’ ba cheart a thabhairt ar ‘mobile phone’ an Bhéarla. Léirítear le cuardach Gaois.ie gurbh é ‘fón póca’ (170 tagairt) a thug an chraobh leis agus ní raibh ach dhá thagairt ann do ‘fón soghluaiste’.