Het corpus Brieven als Buit (origineel) bevat 1.000 Sailing Letters: Nederlandse brieven uit de tweede helft van de 17e tot de vroege 19e eeuw van en aan het thuisfront, die zijn buitgemaakt door kapers en in Britse archieven zijn bewaard. De teksten in het corpus zijn aangevuld met taalkundige informatie. Brieven als Buit-2 is een aanvulling op het originele corpus en bevat ruim 1.300 Sailing Letters. Deze teksten zijn niet taalkundig verrijkt maar wel voorzien van metadata.

English version

Brieven als Buit corpus

The Sailing Letters

Approximately 40,000 Dutch letters from the second half of the 17th century to the early 19th century have been gathering dust in British archives for centuries. These so-called Sailing Letters were not only sent home by sailors and others from abroad, but it was also the other way round: from the Netherlands, spouses, parents, children and other family members kept in touch with their loved ones by sending letters. However, many of these letters never reached their destinations. During the Anglo-Dutch wars they were often taken as loot by privateers and confiscated by the High Court of Admiralty in aid of legal procedures related to privateering. These confiscated letters from men, women and even children represent priceless material for historical linguists. They provide insight into the as yet largely unknown everyday Dutch from the past, the colloquial Dutch of people from the middle and lower classes.

The Brieven als Buit corpus (original)

The Brieven als Buit (Letters as Loot) corpus is a selection of around a thousand letters from this large collection. The compilation of the corpus and the transcription of the materials has been realized through the research programme Brieven als Buit / Letters as Loot. Towards a non-standard view on the history of Dutch, led by Prof. Dr. Marijke van der Wal (Leiden University). The corpus has been annotated with word classes and lemmas by the Dutch Language Institute. The annotation of the entire corpus has been manually verified.

The Brieven als Buit-2 corpus (addition)

The Brieven als Buit (Letters as Loot)-2 corpus is a selection of over 1300 letters from the large collection of Sailing Letters. The corpus is a spin-off of the research programme Brieven als Buit / Letters as Loot. Towards a non-standard view on the history of Dutch, led by Prof. Dr. Marijke van der Wal (Leiden University). Unlike the first Brieven als Buit corpus, the letters in this corpus have not been linguistically enriched. Instead, metadata have been added to the letters.

Differences original and addition

Brieven als Buit (original)Brieven als Buit-2 (addition)
Balanced corpusCollection of letters
Number of letters: 1033Number of letters: 1386
Periods: 1661-1673; 1777-1783Periods: 1661-1673; 1751-1758; 1773-1783
Offers transcriptions, photos of the original letters and metadataOffers transcriptions, photos of the original letters and metadata
Grammatically tagged and lemmatized transcriptions, enabling a combined search for word and lemma.No grammatically tagged or lemmatized transcriptions. Searches are restricted to words.
Private letters (90%), business letters (10%)Private letters (74%), private-business or business letters (26%)
Gender information fully researchedGender information fully researched
Social class and age fully researchedSocial class and age partly researched
Autograph status fully researchedAutograph status 83% researched


De Sailing Letters

Ongeveer 40.000 Nederlandse brieven uit de tweede helft van de 17e tot de vroege 19e eeuw hebben eeuwenlang onder het stof gelegen in Britse archieven. Deze zogeheten Sailing Letters zijn niet alleen vanuit het buitenland door zeelieden en anderen naar het thuisfront verstuurd. Ook vanuit Nederland bleven echtgenotes, ouders, kinderen en andere familieleden met briefverkeer in contact met hun geliefden. Veel brieven hebben hun bestemming echter niet bereikt: ze werden tijdens de oorlogen tussen Nederland en Engeland buitgemaakt door kapers en in beslag genomen door het High Court of Admiralty voor de procesgang rond kapingen. Deze geconfisqueerde brieven van mannen, vrouwen en zelfs kinderen zijn voor historisch taalkundigen van onschatbare waarde. Ze geven namelijk toegang tot het tot nog toe grotendeels onbekende alledaagse Nederlands uit het verleden, het informele Nederlands van mensen uit de middenklasse en lagere klassen.

Het corpus Brieven als Buit (origineel)

Het corpus Brieven als Buit is een selectie van ongeveer duizend brieven uit deze grote collectie. De samenstelling van het corpus en de transcriptie van het materiaal is gerealiseerd binnen het onderzoeksprogramma Brieven als Buit / Letters as Loot. Towards a non-standard view on the history of Dutch, geleid door prof. dr. Marijke van der Wal (Universiteit Leiden). Het corpus is taalkundig verrijkt met woordsoort en lemma door het Instituut voor de Nederlandse Taal (INT). De annotatie is manueel geverifieerd voor het hele corpus.

Het corpus Brieven als Buit-2 (aanvulling)

Brieven als Buit-2 is een selectie van ruim 1.300 brieven uit de grote collectie Sailing Letters. Het corpus is een spin-off van het onderzoeksprogramma Brieven als Buit / Letters as Loot. Towards a non-standard view on the history of Dutch, geleid door prof. dr. Marijke van der Wal (Universiteit Leiden). Anders dan bij het corpus Brieven als Buit zijn de brieven uit dit corpus niet taalkundig verrijkt. Wel zijn er metadata aan de brieven toegevoegd.

Verschillen origineel en aanvulling

Brieven als Buit (origineel)Brieven als Buit-2 (aanvulling)
Gebalanceerd corpusVerzameling brieven
Aantal brieven: 1033Aantal brieven: 1386
Periodes: 1661-1673; 1777-1783Periodes: 1661-1673; 1751-1758; 1773-1783
Biedt transcripties, foto’s van de originele brieven en metadataBiedt transcripties, foto’s van de originele brieven en metadata
Grammaticaal getagde en gelemmatiseerde transcripties. Dit maakt zoeken op woord én op lemma mogelijk.Geen grammaticaal getagde en gelemmatiseerde transcripties. Dit maakt alleen zoeken op woord mogelijk.
Private letters (90%), business letters (10%)Private letters (74%), private-business or business letters (26%)
Gender volledig onderzochtGender volledig onderzocht
Sociale klasse en leeftijd volledig onderzochtSociale klasse en leeftijd gedeeltelijk onderzocht
Autograafstatus volledig onderzochtAutograafstatus 83% onderzocht