error typology for automatic proof-reading purposes4.2.10 referential problems (rp) _____59

Uppsala University Master’s thesis Department of Linguistics Language Engineering Programme Error Typology for Automatic Proof-reading Purposes Olga Wedbjer Rambell Autumn 2000 Supervisor: Anna Sågvall Hein

Upload: others

Post on 09-Jul-2020




0 download


Page 1: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

Uppsala University Master’s thesis

Department of Linguistics

Language Engineering Programme

Error Typology for Automatic Proof-reading Purposes

Olga Wedbjer Rambell Autumn 2000

Supervisor: Anna Sågvall Hein

Page 2: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

����������� ����������� ����� � ������������������ �"!#�"$�� %'&�(*)+)�, � %'-/.10�2�340�.15�36.1087�9#:�:<; � 9#=�.2�340�>@?�:�:1ACB

DE�$"!"F����GH�$��I�KJ�LEH��� M ���N��OQPDE�$"!#FR���GHK$��I�"!#�"$�� S�T�T�U'TWV�X'Y�U�Z#U\[�XI]^U'T _a`'b�U�cEd�bfe"g�hiT�U'Uj] k T�ld�m'eon�[@hi`'T#Y�U'p�l�p

qrJKLsHI��t���RuIGv���w P��P

x ��y ziG�w|{}����w|u�����w|!"H�$�� (~0�0�.�%���>�5.�A4A���=�340���M�=���.19��#�*=�0'��:�; � 340�>��'3CB��#34-/B��R�W����B�.1AC.�*0'3�5=�9#B�3���������:���� P�� ��% � � � PI��� �W����B�.1AC.��%���=�2�=�0� �*.13�A4�.10'0�.1��A�340�> O �'� O Bf=

� J��#�I�����#w|� �~A6>�.�� =�2�¡#¢/=�9 )+.1�~¡�=�A�A£K¤¥�����������W¦§���f!"1�� 7�3C=�9f9#= � 7�.1�'A^%�:�0�2�.>

¨~�©'ª«����¬�w =�9�9­:19W������:�AC:�>�����A6.10�>���.>�=W=�9�9#:�9#B���% �®=f2�3CB�¯� H�w|�#��G�� °�± ²³²µ´�´�¶µ´�·"¸'¹+¶µºj¶�»�¸N¼j½+¾I± ¼¿²À´�¾´�Á�± ¼Â¾º¿º¿¸ ¶µ´�»'¾Ã ¼j½Â²�ÄaÁ�ºj¾�½Å½Â¼ Æ"¼ Á�¾ Ç

·"¼Â¶µÃ«½Â¸R½Â·"²ÀÈɶµÆW¾º¿º�Ê'¼¿Ã�Ä�½+¶µÆ ºj¾Ã »�Ë ¾�»�²³´�²µºj¾·#²�Äa²µ´�´�¶µ´�½ÌÆ�¶µËÌÃWļ¿ÃrÁ1¶µÃ ·#²µÈs¹+¶µ´�¾´�¸NÍ^Îϲ�Ä�¼j½Â±Ïà ²µÎE½j¹+¾¹Ì²À´*¾´�·"¼¿Á�º4²�½ÅаK± ²i± ¼¿²µ´ ¾´ ÇÁ�± ¸@Á�¶µÃ�½Â¼j½j·�½�¶µÆ Æ�¶µËÌ´�º¿²ÀÑ ²Àºj½ÅÐÒI¾Á±Ïº¿²ÀÑ ²Àº�¼j½+»�¼4Ñ ²Àë¾IÓ�Á�±W¾´�¾Á�·"²À´Á1¶�Ä�²µÔ�´�²�½jË̺4·"¼¿ÃW»�¼4ë¾ÃÏÕ�Á±�¾´�¾Á�·#²µ´�²µ´�´�¶µ´�·#¸'¹Ì²iÁ1¶�Ä�²i·�¶iÖ�²×¾�½ ǽ¼j»�à ²�Äa·�¶i²µÑ�²µ´�¸N²µ´�´�¶µ´�²Àà ·"´�¸N¼¿Ãr·"± ²i²µ´�´�¶µ´*Ä�¾·�¾ÖK¾�½j²�а�± ²³Èؾ¼¿ÃrÆ�¶µÁ�Ë+½+¶µÆ ·#± ²i·#¸'¹+¶µºj¶�»�¸@±W¾�½�Ö�²À²µÃE¶µÃÏ·"± ²i´�²ÀÁ1¶�» à ¼ Ç·"¼Â¶µÃ«¶µÆ ²À´�´�¶µ´�½jÔ�¶µÃrÎϱW¾· ¼¿Ã Æ�¶µ´�Èؾ ·#¼j¶µÃϼ½�à ²µ²�Ä�²�Ä×Æ�¶µ´*Ä�²µ·"²ÀÁ�·"¼4Ã�»¾Ã�Äa´�²ÀÁ1¶�»�à ¼j½Â¼¿Ã�»NÄ�¼¿Æ#Æ"²µ´�²Àà · º ¾Ã�»�Ë+¾�»�²i²À´�´�¶µ´�½\а�± ²³Á1¶µ´�´�²µÁ·"¼j¶µÃÈؾ�Ä�²³Ö�¸@·#± ²³¹Ì´�¶�¶µÆ Ç ´�²�¾�Ä�²µ´*¾Ã�Äa·#± ²i¹Ì²À´ Æ�¶µ´ Èپà Á�²a¶µÆ ·"± ²¹Ì´�¶�¶µÆ Ç ´�²�¾�Ä�¼¿ÃW»�·�¶�¶µº�±�¾�½+¾ºj½Å¶iÖ�²µ²ÀÃÏ·�¾Ê'²ÀÃϼ¿Ã ·�¶iÁ1¶µÃW½j¼jÄ�² ´�¾ ·"¼j¶µÃÎϱ ¼¿º¿²³Á1¶µÃ ½Â·"´�ËÌÁ�·#¼¿Ã�»8·#± ²i²À´�´�¶µ´�·"¸'¹+¶µºj¶�»�¸�а�± ²iÁ�¾Ë+½j²a¶µÆ ·"± ²²µ´�´�¶µ´�±W¾�½�Ö�²À²µÃE»�¼4Ñ ²ÀÃÏ·"± ²iºj¶µÎr²�½Â· ¹Ì´�¼ ¶µ´�¼ ·"¸�Ð

Page 3: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

Executive Summary

The error typology is a hierarchially organised classification system for all kinds of language related errors found in contemporary Swedish newspaper articles. The error typology is to be used in the deve-lopment of a proof-reading tool for Danish, Norwegian, and Swedish in the SCARRIE project. In specific, the typology forms a basis for the error type code attached to each entry in the Error Corpora Database (ECD), and for the parser in the resulting proof-reading system. It is of great importance in the development of the proof-reading tool to know what types of errors that in fact occur in newspapers, and to have these systematised in an appropriate manner. Potential errors have not been considered, which means that the typology is solely based on factual errors and not on hypothetical ones. The Swedish newspapers Svenska Dagbladet and Upsala Nya Tidning have supplied material for the development of the error typology and the ECD where all the error instances with their corrections and error types codes are stored. The language errors have been detected and corrected by professional proof-readers at the newspapers. The typology is descriptive, not normative. There are at least four possible dimensions according to which a division between errors could be made: the nature of the error, the cause of the error, the context in which the error appears, and the correction of the error. An error must be recognised before it can be corrected. Therefore, the erroneous feature and the context are the most important characteristics. The principle is thus that two errors of the same kind ap-pearing in a similar context may be given the same error type code even if there might be differences in how the errors could be corrected. The cause of the error has been given the lowest priority. For automatic proof-reading purposes, the cause was found to be of less interest than it would be for peda-gogical purposes. The strategy of the proof-reading tool has been taken into consideration while constructing the error typology. The grammar checker will use a combined approach of linguistic analyses and the application of rules of anticipated errors. Correction will be based on a grammar of foreseen errors. Consistency with regard to standard or style will also be checked. Style checking will concentrate on lexical choice, variation in inflection and, to some extent, syntax. Errors in newspapers may be of many different types. To capture this variety, the typology needs to be quite elaborate. The hierarchy consists of four levels which are given the following terms: group, category, subcategory, and specification. There are five groups: spelli ng errors, grammar problems, punctuation problems, graphical problems, and style, meaning, and reference problems. Each group contains a number of categories which in turn are divided in subcategories. A more detailed level may occur within the subcategories for further specification of the errors. The basic division between error types is based on how much context is needed for an error to be recognised. Spelli ng errors require the smallest context, especially misspellings resulting in non-lexical words. A word is a sequence of characters separated by space, punctuation marks, or graphical signs except hyphens, and, in certain occasions, colons and apostrophs. This string based definition of a word is important for the classification. Spelli ng errors resulting in existing words can only be recognised in a wider context. Such an error belongs to the grammar problems group if it can be detected by means of grammatical features. Otherwise it belongs to the style, meaning, and reference group. Errors for which a context wider than one sentence is needed belong to this last group as do problems involving a choice between alternative correct word forms. The punctuation problems group comprises erroneous end of sentence punctuation, and erroneous comma usage, but also missing capital letter in the beginning of the sentence. Graphical problems are problems related to the typographical representations of texts and signs such as dashes, quotation marks, and space signs. The three highest levels in the hierarchy have been assigned a code of two letters; the specification level has been given a two number code starting with 01 in the order in which they have appeared in the material. Concatenated, these codes form the error type code assigned to every language error in the Error Corpora Database. The resulting error type code thus consists of eight tokens, and each level has its own position in the code.

An error typology built on factual errors occurring in newspapers will perhaps never be complete. During application and revision the typology was found to be adequate for describing Swedish errors. So far, approximately 9,000 error instances have been pro-cessed. Continued work with the Error Corpora Database will show how well the typo-logy conforms to Danish and Norwegian. The typology is open to modifications. In specific, new types can readily be added at the lower levels of the typology. If there is a need for a less detailed typology, only the higher levels may be used.

Page 4: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59
Page 5: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

Uppsala university Department of Linguistics SCARRIE 21 January 1998

Err or Typology

for Automatic Proof-reading Purposes

Olga Wedbjer Rambell


DEL 2.1


Page 6: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59


This report is an updated version of the first version as a result of the on-going revision of the Error Corpora Database. The main difference is that approximately 30 new specifications have been added, almost all of them punctuation problems or graphical problems. A few subcategories has been added as well . For a handful of error types, the text has undergone some minor changes.

Page 7: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59


1 Introduction _______________________________________________________1

2 Method____________________________________________________________2

3 Mater ial ___________________________________________________________3

4 Err or Typology_____________________________________________________5

4.1 Spelling Errors (SE) ___________________________________________________7

4.1.1 Capital Letter Err ors (CP) _______________________________________________7 Proper nouns (PN) ____________________________________________________7 Compounds with proper nouns (CC) ______________________________________8 Derivations of proper nouns (DC) ________________________________________8 Personal titl es (PT)____________________________________________________8 Foreign names (FT) ___________________________________________________9

4.1.2 Word Formation Err ors (WF) ____________________________________________9 Binding -s- missing (SM)_______________________________________________9 Binding -s- incorrect (SI)______________________________________________10 Hyphen missing (HM) ________________________________________________10 Hyphen incorrect (HI) ________________________________________________10 Split words (SW) ____________________________________________________11 Concatenated words (CW)_____________________________________________12 Misplaced space (MS) ________________________________________________13 Coordination with common word part (CO) _______________________________13 Abbreviations (AB) __________________________________________________14 Other word formation errors (OP) _______________________________________14

4.1.3 End of L ine Hyphenation Er rors (HY) ____________________________________14 Proper according to the morpheme boundary rule and to the one consonant rule

(MC) _________________________________________________________15 Proper according to the morpheme boundary rule only (MB) __________________15 Proper according the one consonant rule only (CR) _________________________15 Proper according to pronounciation and other problems (PR)__________________15

4.1.4 (Other) Spelli ng Err ors (OS) ____________________________________________16 Proper nouns (PN) ___________________________________________________16 Foreign words (FW)__________________________________________________16 Number expressions (NB) _____________________________________________16 Other words (OW) ___________________________________________________17

4.2 Grammar Problems (GP) _____________________________________________18

4.2.1 Noun Phrase (NP) _____________________________________________________19 Agreement (AG) ____________________________________________________19 Gender (GE)________________________________________________________21 Number (NB) _______________________________________________________22 Species (SS) ________________________________________________________22 Case (CA) _________________________________________________________24 Adjective phrase (AP) ________________________________________________25 Participles (PE) _____________________________________________________26 Numerals (NL)______________________________________________________26 Nouns (NN) ________________________________________________________27 Pronouns (PN) ______________________________________________________27 Choice of preposition after a noun (CP)___________________________________28 Preposition missing after a noun (MP)____________________________________30 Other noun valency problems (NV)______________________________________30 Coordination (CO) ___________________________________________________31 Word order (WO)____________________________________________________31 Other problems (OP) _________________________________________________32

Page 8: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

4.2.2 Adjective Phrase (AP) __________________________________________________32 Wrong word category (WC) ___________________________________________32 Choice of preposition after an adjective (CP) ______________________________32 Comparing ”än” (CM) ________________________________________________33

4.2.3 Adverb Phrase (AB) ___________________________________________________33 Word missing (WM) _________________________________________________33 Doubled word (DW) _________________________________________________33 Word order (WO)____________________________________________________33 Other problems (OP) _________________________________________________33

4.2.4 Prepositional Phrase (PP) _______________________________________________33 Prepositions (PR) ____________________________________________________34 Complements (CO) __________________________________________________35

4.2.5 Conjunctions and Conjunctive Adverbs (CN) ______________________________36 Conjunction or conjunctive adverb missing (CM)___________________________36 Complex conjunction (CC) ____________________________________________37 Doubled conjunctions (DW) ___________________________________________37 Erroneous conjunction (EC)____________________________________________37 Wrong word category (WC) ___________________________________________38

4.2.6 Verb Phrase in the L imited Sense (VF) ____________________________________38 Main verb in the finite form (MF) _______________________________________39 Temporal auxili ary verb in the finite form + Main verb in the supine (TS)________40 Existential auxili ary verb in the finite form + Main verb in the perfect participle

(EP) __________________________________________________________41 Auxili ary verb in the finite form + Main verb in the infinitive (AI) _____________42 Combination of auxili ary verbs + Main verb (AM)__________________________44 Coordination of verbs (CO) ____________________________________________44 Infinitive in infinitive phrase (IP) _______________________________________45 Other problems (OP) _________________________________________________46

4.2.7 Verb Valency (VV) ____________________________________________________46 Intransitivity (IN)____________________________________________________46 Transitivity (TR) ____________________________________________________47 Copula (CO)________________________________________________________47 Reflexivity (RE)_____________________________________________________47 Passive constructions (PC)_____________________________________________48 Object with infinitive (OI) _____________________________________________48 Prepositional phrase (PP)______________________________________________49 Infinitive phrase (IP) _________________________________________________49 Clause (CL) ________________________________________________________50 Position holding ”det” (ID) ____________________________________________50 VF missing (VM)____________________________________________________50 NP missing (NM)____________________________________________________51 Choice of preposition/adverb after verbs (CP)______________________________51 Preposition/adverb missing after verbs (MP)_______________________________53 Repetition of preposition/adverb (RP) ____________________________________55

4.2.8 Pronoun Case (PC) ____________________________________________________55 Subjective form correct (SF) ___________________________________________55 Objective form correct (OF) ___________________________________________56

4.2.9 Agreement (AG)_______________________________________________________56 NP and AP – subject and complement (NA)_______________________________56 NP and AP – object and complement (NO) _______________________________57 AP and AP – subject and complement (AA) _______________________________57 NP and perfect participle – subject and complement (NE) ____________________58 NP and pronoun – subject and complement (PN) ___________________________58 NP and NP – subject and complement (NP) _______________________________58 NP and NP in ”som” phrases – subject and complement (NS) _________________58 NP and NP – object and complement (NN) ________________________________59

Page 9: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

4.2.10 Referential Problems (RP) ______________________________________________59 Pronoun reference (PN) _______________________________________________59 Choice of VF (VF)___________________________________________________59

4.2.11 Word Order (WO)_____________________________________________________60 Inversion (IN)_______________________________________________________60 Inserted phrase (IP) __________________________________________________60 Adverb phrase (AB)__________________________________________________60 Noun phrase (NP) ___________________________________________________61 Prepositional phrase (PP)______________________________________________62 Other word order problems (OP) ________________________________________62

4.2.12 Wrong Word Category (WC)____________________________________________63 Adjective (AV)______________________________________________________63 Adverb (AB) _______________________________________________________63 Pronoun (PN) _______________________________________________________64

4.2.13 Other Grammar Problems (OG) _________________________________________64 Coordinations (CO) __________________________________________________64 Word missing (WM) _________________________________________________64 Doubled words (DW)_________________________________________________64 Heading (HE)_______________________________________________________64 Strange syntax and other grammatical problems (OP)________________________64

4.3 Punctuation Problems (PU)____________________________________________65

4.3.1 End of Sentence Punctuation (ES) ________________________________________65 Punctuation mark missing (PM)_________________________________________65 Choice of end of sentence punctuation (EC) _______________________________66 Full stop together with quotation marks or parentheses (FS)___________________67 One punctuation mark too many (PT) ____________________________________67 Not end of sentence (NE)______________________________________________68 Other end of sentence punctuation problems (OP) __________________________69

4.3.2 Capital Letter (CP) ____________________________________________________69 Point (PT)__________________________________________________________69 Colon (CN) ________________________________________________________69 Quotation (QN) _____________________________________________________70 Not beginning of sentence (NO) ________________________________________70

4.3.3 Comma (CO) _________________________________________________________70 Main clauses (MC)___________________________________________________70 Subordinate clause (SC)_______________________________________________70 Phrases / units (PH) __________________________________________________71 Parts of phrases / units (PA)____________________________________________71 ”Clarity criteria” (CC) ________________________________________________72 Comma instead of word (IW) __________________________________________72 Comma correct (CO) _________________________________________________72 Other problems with commas (OP) ______________________________________73

4.3.4 Dash within the Sentence (DW) __________________________________________73 Phrases / units (PH) __________________________________________________73 Dash correct (DC) ___________________________________________________73

4.3.5 Colon (CN) ___________________________________________________________74 Colon correct (CC)___________________________________________________74 Colon missing (CM) _________________________________________________74 Incorrect usage of colon (IC) ___________________________________________75

4.3.6 Semicolon (SN)________________________________________________________75 Semicolon correct (CS) _______________________________________________75 Semicolon missing (SM) ______________________________________________75 Incorrect usage of semicolon (IS) _______________________________________76

4.3.7 Other Punctuation Problems (OP)________________________________________76 Erroneous punctuation in certain text types (EP)____________________________76

Page 10: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

Other erroneous punctuation marks (EM) _________________________________76

4.4 Graphical Problems (GR) _____________________________________________77

4.4.1 Space (SC) ___________________________________________________________77 Missing space around signs (BA) _______________________________________77 Missing space before signs (SB) ________________________________________77 Missing space after signs (SM) _________________________________________78 Too littl e space (SL)__________________________________________________79 Too much space (ST)_________________________________________________79

4.4.2 New Line / Paragraph (NL) _____________________________________________80 New line / paragraph to be removed (NR) _________________________________81 Erroneously placed line break (AB)______________________________________81 New line / paragraph to be inserted (NI) __________________________________81

4.4.3 Dash before Direct Speech (DS) __________________________________________82 Dash missing (DM) __________________________________________________82 Incorrect hyphen (IH)_________________________________________________82 Incorrect dash (ID)___________________________________________________82 Incorrect underscore (IU)______________________________________________82

4.4.4 Dash within the Sentence (DW) __________________________________________82 Incorrect hyphen (IH)_________________________________________________83 Incorrect underscore (IU)______________________________________________83 Incorrect dash (ID)___________________________________________________83

4.4.5 Quotation Marks (QM)_________________________________________________83 Quotation within a quotation (WQ) ______________________________________83 Incorrect usage of single quotation marks (IS) _____________________________83 Quotation marks around titles, names etc (TI)______________________________84 Quotation marks around citations etc (CI)_________________________________84 Quotation after ”så kallade” etc (SK)_____________________________________85 Other incorrect quotation marks (OP) ____________________________________85

4.4.6 Parentheses (PA) ______________________________________________________85 Parentheses not in pair (PP) ____________________________________________85 Parentheses to be removed (PR) ________________________________________85 Parentheses missing (PM) _____________________________________________86

4.4.7 Typographical Err ors (TY) _____________________________________________86 Lower case and upper case characters (GC) _______________________________86 Italic (IT) __________________________________________________________86 Bold (BO) _________________________________________________________87 Font size (FS)_______________________________________________________87 Other font problems (FO) _____________________________________________87 Margins (MA) ______________________________________________________87

4.4.8 Other Graphical Problems (OP) _________________________________________88 Hyphens (HY) ______________________________________________________88 Accent (AC)________________________________________________________88 Apostroph (AP) _____________________________________________________88 Other signs (OS) ____________________________________________________88

4.5 Style, Meaning, and Reference (SP) _____________________________________89

4.5.1 Preferred Spelli ng (PS) _________________________________________________89

4.5.2 Abbreviation (AB) _____________________________________________________89 Choice of abbreviated form (CA) _______________________________________89 Full expression preferred (FE) __________________________________________90

4.5.3 Number Style (NS)_____________________________________________________90 Number beginning the sentence (BS) ____________________________________90 Small numbers (SN)__________________________________________________90 Decimal numbers (DN) _______________________________________________90

Page 11: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

Large numbers (LN) _________________________________________________91 Approximate figures (AF) _____________________________________________91 Ordinals (OR)_______________________________________________________91 Year, date, time etc (YD)______________________________________________91 Other problems (OP) _________________________________________________93

4.5.4 Corr ect Word Category but Wrong Word (WN) ____________________________93 Adjectives (AV)_____________________________________________________93 Adverbs (AB)_______________________________________________________93 Conjunctions and Conjunctional Adverbs (CN) ____________________________93 Nouns (NN) ________________________________________________________93 Prepositions (PR) ____________________________________________________94 Pronouns (PN) ______________________________________________________94 Verbs (VB)_________________________________________________________94 Interjections (IN) ____________________________________________________94

4.5.5 Choice of Words and Expressions (CW) ___________________________________94

4.5.6 Choice of Signs (CS) ___________________________________________________94 Dash => Colon (CD) _________________________________________________94 Colon => Dash(es) (DS) ______________________________________________95 Dash => Slash (SL) __________________________________________________95 Points in lists (PE) ___________________________________________________95

4.5.7 Choice of Sentence Boundar ies (CB) ______________________________________95 One sentence => Two sentences (OT) ____________________________________95 Two sentences => One sentence (TO) ____________________________________95

4.5.8 Choice of Syntactic Construction (SC) ____________________________________95 Omitted auxili ary ”ha” (OM)___________________________________________95 Omission of relative pronoun (OR) ______________________________________96 The adverb ”så” (SR)_________________________________________________96

4.5.9 Consistency (CN) ______________________________________________________96 Number (NB) _______________________________________________________96 Spelli ng / Word form (SP) _____________________________________________96 Number style (NS) ___________________________________________________96

4.5.10 Redundancy (RD) _____________________________________________________96

4.5.11 Referential Problems (RP) ______________________________________________97 NP and NP (NP)_____________________________________________________97 NP and AP (NA) ____________________________________________________97 Clause and pronoun (CR)______________________________________________97 General and specific reference (GS) _____________________________________98

5 Closing Remarks___________________________________________________99

L iterature__________________________________________________________100

Appendix A: ECD – Err or Corpora Database – Specification_______________101

Page 12: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 1 –

1 Introduction

The error typology is a classification system of language errors to be used in the development of a proof-reading tool for Danish, Norwegian, and Swedish in the SCARRIE project. The typology forms a basis for the error type code attached to each entry in the Error Corpora Database (ECD)1, and for the parser in the resulting proof-reading system. The starting point was to create a distinct and easily used system of error types for describing and classifying Swedish language errors, especially grammatical ones. For this purpose errors have been collected from intended users of the proof-reading tool such as newspapers. It is of great importance to know what types of errors that in fact occur in newspapers, and to have these systematised in an appropriate manner. Potential errors have not been considered, which means that the typology is solely based on factual errors and not on hypothetical ones. Hopefully, the error typology will prove useful for Danish and Norwegian as well . The performance of the proof-reading tool has been taken into consideration while constructing the error typology. The grammar checker will use a combined approach of linguistic analyses and application of rules of anticipated errors. It will recognise phrase constituents but probably not syntactic functions, sentence structure or verb phrases. Correction will be based on a grammar of local rules of foreseen errors. Consistency with regard to standard or style will also be checked. Style checking will concentrate on lexical choice, variation in inflection and, to some extent, syntax. The error typology is a part of work package 2 of the SCARRIE project which is funded by the Language Engineering Sector in the Telematics Application Programme of the European Union.2 The SCARRIE consortium consists of a co-ordinating partner, four project partners, and nine sub-contractors. Center for Sprogteknologi in Copenhagen will develop the Danish part of the SCARRIE pilot application, Humanistik Datasenter in Bergen will develop the Norwegian part and the Department of Linguistics at Uppsala university will develop the Swedish part. One of the subcontractors, Stichting Cognitieve Technologie, has already developed a proof-reading tool for Dutch that will be used in the SCARRIE project. Newspapers and publishing houses in Sweden (Svenska Dagbladet, Upsala Nya Tidning), Norway (Bergen Trykk AS), and Denmark (Berlingske Tidende, Munksgaard International Publishers) have contributed to the project by defining user demands on an automated proof-reading tool. They are also the main suppliers of text material for the dictionaries and the error corpora. In the final phase, these users will act as test beds for the SCARRIE proof-reading software. After the project, the co-ordinating partner of the project, WordFinder Software, will package the SCARRIE results into its own interface, and market it as a product. The ultimate goal for WordFinder Software is to develop a proof-reading tool for everyone using a word processor when they write in Swedish, Danish or Norwegian. In this report the error typology is described in chapter 4, but first the method and the material used will be presented in chapters 2 and 3. Nearly every error type is accompanied by examples with the first version being the incorrect version and the second being the result of the proot-reader’s corrections. The two sentences are separated by a slash (/). Notes about the sources of the examples are given in parentheses.

1 The ECD specification can be found in Appendix 1. 2 More information about the SCARRIE project can be found on the Internet:

Page 13: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 2 –

2 Method

The main focus of the typology has been on the recognition of errors, on what information is needed for detecting different language errors. The correction made by the proof-reader has also been taken into con-sideration. More detailed discussions of the typology guidelines are found in chapter 4. If the incorrect sentence has been corrected in more than one aspect, it is first established whether the corrections depend on each other or not. If they do, they will be treated as one error, otherwise as separate errors. All errors that have been detected and all corrections that have been made in the material used have been made by professional proof-readers at the user sites. The typology is descriptive, not normative. Therefore, when creating the typology, errors that might seem to be correct and corrections that might seem to be erroneous must also be given an appropriate error type code. The error typology has been constructed in three steps or phases. At first, the typology was developed simultaneously with the collection of a limited number of errors from Svenska Dagbladet (SvD) and Upsala Nya Tidning (UNT). In the first phase, a preliminary typology was created and presented to the Danish and Norwegian partners for comments. In the second phase, the preliminary typology was tested by applying it to an extended material from SvD and UNT. In the third and last phase, the typology was revised, and changes were made in the Error Corpora Database, where all the error instances with their corrections and error types codes were stored. No new material was added at this stage.

Construction A thousand errors from SvD were systematised in a preliminary version of the error typology. The typology was constructed at the same time as the errors were analysed, and is thus very much dependent on the material on which it has been based. The question whether the material is representative or not has to be considered. The answer will be found when testing more material and classifying new error instances: If the errors can easily be classified without having to add or in any other way alter the classes, the typology embraces representative errors.

Application Material from SvD and UNT was classified according to the preliminary typology. The typology was expanded to cover new error types by making the existing error type codes cover more problems, and by introducing new error type codes. This phase was carried out by students at the Department of Linguistics at Uppsala university. Three students classified the errors, and three students typed the sentences, the error type codes and complementing information in files forming the preliminary Error Corpora Database.

Revision The outcome of the application was evaluated. The structure of the typology seemed to be appropriate. Problems that had arised during the application phase were adressed, and the typology was changed to become more detailed and more consistent. The main changes done concerned verb related problems. The report has also been extended and rewritten as a result of the application and revision phases. The Error Corpora Database was then revised in accordance with the improved typology.

Page 14: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 3 –

3 Material

The Swedish newspapers Svenska Dagbladet (SvD) and Upsala Nya Tidning (UNT) have supplied material for the development of the error typology. The language errors have been detected and corrected by professional proof-readers at the newspapers, following the norms present. Both SvD and UNT have language norms of their own printed in booklets. In the three phases of the development of the error typology different material has been used. Each source has been given a source code, to which the source notes at the examples in this report are referring.

Construction The newspaper articles, from which the errors have been collected in the construction phase, cover mainly two text types, domestic news and politi cal debate articles not written by journalists.

1. Domestic news articles, SvD (GS) In 1994, Gabriella Sandström made a study of errors found in 29 domestic news articles in 3 versions (from script to printed text). The total amount of errors is 512 (the same error remaining in a following version of the article has only been counted once).

2. Minor study, SvD (MS) A minor study was carried out some years ago by the proof-readers at SvD. The material that has been passed on to the SCARRIE project consists of a concluding summary of their findings plus 25 example texts. The total amount of errors in the example texts is 26.

3. Survey made by a reader, SvD (RS) A language interested reader went through the SvD of May 25, 1996, and found 65 errors. This is the only material used that was not corrected by a professional proof-reader.

4. Collection of SvD articles 1993–1996 (CS) This collection consists of nearly 50 texts with about 1,700 correction marks, of which 300 errors originating from 5 articles have been used in the creation of the error typology. The articles originate from the headings Samtider and Brännpunkt, and cover politi cal debate and other contemporary issues where a more personal style is allowed. The articles have been saved by the proof-readers on their own initiative. It is important to note that the absolute majority of the articles is not written by professional journalists, although the writers most often have an academic education and/or occupation.

5. Upsala Nya Tidning, October 1996 (UNT) Upsala Nya Tidning has supplied the Department of Linguistics with the proof-readers’ paper copies on which they have marked the corrections to be made. The articles are of all genres that usally are proof-read at the newspaper. Five days’ production has been covered.

Application Language errors were supplied from Svenska Dagbladet and Upsala Nya Tidning for the Error Corpora Database. The material from SvD came in electronic form while UNT supplied the department with paper copies as in the previous material delivery (5 above).3 6. Svenska Dagbladet, 1997 (SvD) The reporters’ versions of 734 articles were proof-read. The articles represent seven different text genres: editorials, domestic affairs, foreign affairs, local news, economy, culture, and sports. Two weeks’ production were covered except for the sport pages which include more than two weeks. The articles were all written during the first eight months of 1997. The total number of erroneous sentences was 1965 containing 2,143 errors. Unlike the other materials, the non-proof-read and the proof-read articles were delivered in electronic form. The two versions were compared automatically. Pairs of sentences in which differences were discovered were picked out and manually examined as the other material.

3 See Wedbjer Rambell et al (1998): An Error Database of Swedish

Page 15: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 4 –

7. Upsala Nya Tidning, February–May 1997 (UNT) From February to May errors from 25 days’ normal production were analysed and classified. Just as for the material 5 above, this material covered the genres normally proof-read at the paper. It contained nearly 6,900 errors. There are no statistics for how many articles that are included in the material, nor for their distribution among the sections in the paper.

Revision The material in the Error Corpora Database (i.e. material 6 and 7 above) was analysed again resulting in a revised typology. No new material was added at this stage.

Page 16: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 5 –

4 Err or Typology

This chapter focuses on the error typology for automatic proof-reading purposes. The chapter is divided in five sections, one for each problem group. Examples of nearly every error type code are given. Before the typology is presented in more detail , the basic division lines and fundamental guidelines are discussed. There are at least four possible characteristics according to which a division between errors could be made: the nature of the error, the cause of the error, the context in which the error appears, and the cor-rection of the error. An error must be recognised before it can be corrected. Therefore, the erroneous feature and the context are the most important characteristics. The principle is thus that two errors of the same kind appearing in a similar context would be given the same error type code even if there might be differences in how the errors could be corrected. The cause of the error has been given the lowest priori-ty. For automatic proof-reading purposes, the cause is of less interest than it would be for pedagogical purposes. The error typology is a hierarchially organised classification system of all kinds of language related errors found in contemporary Swedish newspaper articles. The hierarchy consists of four levels which are given the following terms: group, category, subcategory, and specification. Each level is typographically marked in the report as follows:

x.x Group

x.x.x Category


xx specification

There are five groups: spelli ng errors, grammar problems, punctuation problems, graphical problems, and style, meaning, and reference problems. Each group contains a number of categories which in turn are divided in subcategories. A more detailed level may occur within the subcategories for further specification of the errors. The main idea is that the three higher levels (i.e. the groups, the categories, and the subcategories) state the proper or correct usage while the error is specified on the lowest level. (On some occasions this principle is violated as will be shown below.) The basic divisions between error types are based on how much context is needed for an error to be detected. Spelli ng errors require the smallest context, especially misspellings resulting in non-lexical words. A word is a sequence of characters separated by space, punctuation marks, or graphical signs except hyphens, and, in certain occassions, colons and apostrophs. This typographical definition of a word is important for the classification. Spelli ng errors resulting in existing words can only be recognised by looking at a wider context. Such an error belongs to the grammar problems group if it can be detected by means of grammatical features. Otherwise it belongs to the style, meaning, and reference group. Errors for which a context wider than one sentence is needed belong always to this last group as do problems involving choosing between correct word forms. The punctuation problems group contains erroneous end of sentence punctuation, and erroneous comma usage, but also missing capital letter in the beginning of the sentence. Graphical problems are problems related to signs such as dashes, quotation marks, and space signs. The division between the five groups is, however, not always clearcut. The dash within the sentence occurs as a category in both the punctuation problems group (dealing with errors related to the function of the dash in the sentence) and in the graphi-cal problems group (dealing with errors related to how the dash is graphically represented). Choice between a comma and a dash is seen as a style problem thus belonging to the style, meaning, and reference group. Problematic issues will be discussed in more detail i n the following sections. The three highest levels in the hierarchy have been assigned a code of two letters; the specification level has been given a two number code starting with 01 in the order they have appeared in the material. Concatenated, these codes form the error type code assigned to every language error in the Error Corpora Database. The resulting error type code thus consists of eight tokens, and each level has its own position in the code. Although the lower levels have not yet been presented, an example may give an idea of the structure of the typology and its error type codes. Let GP stand for the group of grammar problems, NP for the noun phrase category, and AG for the agreement error subcategory within the NP. Finally, let 02 represent er-roneous species agreement between the premodifier and the noun. The error type code GPNPAG02 will then be assigned to the following example:

Page 17: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 6 –

Polisen avblåser nu den stora brottsutredning. / Polisen avblåser nu den stora brottsutredningen. (GS11A)

The specification level will expand the most when more material is examined. It is easier to give an addi-tional error specification a new sequential number than a two letter combination. In those subcategories lacking a specification level, the error can be assigned the specifiation type code 00 as default. In the work with the typology Swedish language guides as been consulted, such as Svenska skrivregler by Svenska språknämnden (1991), Nationalencyklopedins ordbok (1995–1996), and Svenska Akademiens ordlista (1986). Svensk grammatik by Olof Thorell (1997) and Allmän grammatik by Magnus Ljung and Sölve Ohlander (1982) have been very helpful on grammatical issues. See also the list of literature.

Page 18: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 7 –

4.1 Spelli ng Err ors (SE)

The vast majority of the spelli ng errors can be recognised, and perhaps even corrected, independently of the context in which they appear. A spelli ng error do usually involve only one word. A word is defined as a sequence of letters separated by spaces, punctuation marks, or graphical signs except hyphens, and, in certain cases, colons and apostrophs. Multiword expressions constitute closed context, and errors in such expressions (for instance names consisting of more than one word) belong to the spelli ng errors group. Errors in idiomatic expressions fall outside this category, as do spelli ng errors resulting in existing words. These errors are addressed in the grammar problems group and in the style, meaning, and reference group. The spelli ng errors group consists of four categories:

· Capital Letter Errors (CP)

· Word Formation Errors (WF)

· End of Line Hyphenation Errors (HY)

· (Other) Spelli ng Errors (OS)

4.1.1 Capital Letter Err ors (CP)

There are different types of capital letter errors. The absolute majority of capital letter errors is context independent and therefore possible to correct by using a dictionary, such as proper nouns and compounds and derivations of proper nouns. However, one type is context dependent: If a sentence starts with an erroneous lower case letter, the error is context dependent forming a category within the punctuation pro-blems group. Ordinary words starting with a capital letter and not being the first word in the sentence are also dealt with in the punctuation problems group since ordinary words are not proper nouns. Proper nouns are however not always easily distinguishable from ordinary words. For instance, a proper noun does not necessarily begin with a capital letter. In cases where the status of a word is unclear, it is dealt with as if it is a proper noun, thus belonging to the spelli ng errors group. Capital letter problems in abbreviations belong either to the word formation category or to the style, meaning, and reference group – the former classification is used if the form of the abbreviation is incorrect, and the latter if it is a question of choice between two correct forms. Problems with erroneous capital letters not being the first letter of the word are perceived to be ordinary spelling errors. Capital letter problems may coexist with word formation problems. The error combinations belong to the proper word formation category and are not dealt with in the capital letter category. The subcategorisation of capital letter errors is based on what type of word is involved: proper noun, compound with proper noun, derivation of proper noun, personal titl e, and foreign name. The specifications state the erroneous form and the correct form of the letter.

Proper nouns (PN) The proper noun subcategory contains all those capital letter errors related to names of different kinds: persons, organisations, companies, countries, cities, etc. Depending on what the proper nouns denote, different ” rules” apply. These rules are newspaper specific, not all of them are in accordance with the recommendations Svenska språknämnden gives in Svenska skrivregler (1991). The use of capital letters is rather a matter of norms than rigid rules, and it ought to be possible for each user to adjust these norms in the final proof-reading program.

01 lower case letter => upper case letter

Lars Hjalmarsson, ridsportförbundets nye generalsekreterare, hoppas på en snar förbättring av förbundets sponsorsituation. / Lars Hjalmarsson, Ridsportförbundets nye generalsekreterare, hoppas på en snar förbättring av förbundets sponsorsituation. (SvD Sport)

Page 19: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 8 –

02 upper case letter => lower case letter

Förutsättningen är att Sjöfartsverket bedömer åtgärden som lämplig ... / Förutsättningen är att sjöfartsverket bedömer åtgärden som lämplig ... (GS2A)

Compounds with proper nouns (CC) In Swedish a compound containing a proper noun ought to have a capital letter, no matter where in the compound the name occurs, if it has a name character rather than denoting a species. This rule is not consequently applied by the proof-readers. Capital letter problems may coexist with incorrect hyphenation of compounds. These error combinations are addressed in the hyphen incorrect subcategory of the word formation category. However, if the hyphenation is correct but there is a capital error problem in the second part of the compound, the error is dealt with as a capital letter error.

01 lower case letter => upper case letter

I lerumfallet har dessutom Kommunalanställdas förbund medgivit en visstidsdispens som medfört att ambulansförarna kunnat komma upp i de här, som vi tror, extrema övertidssum-morna. / I Lerumfallet har dessutom Kommunalanställdas förbund medgivit en visstidsdispens som medfört att ambulansförarna kunnat komma upp i de här, som vi tror, extrema övertidssum-morna. (GS1A)

02 upper case letter => lower case letter

Karlskrona förväntas bli en mötesplats för företag i Östersjöstaterna med mer än 50 milj oner människor. / Karlskrona förväntas bli en mötesplats för företag i östersjöstaterna med mer än 50 milj oner människor. (SvD Inrikes)

När det ställs samman bli r intrycket rätt beklämmande, ty vid sidan av Palmes entydiga för-dömanden av Tjeckoslovakiens Husakregim, Franco-Spanien, grekjuntan, apartheid i Sydafri-ka och Pinochetregeringen i Chile samt uppbackningen av frigörelse från kolonialväldena står mycken tvetydighet eller värre i andra fall . / När det ställs samman bli r intrycket rätt beklämmande, ty vid sidan av Palmes entydiga för-dömanden av Tjeckoslovakiens Husakregim, Franco-spanien, grekjuntan, apartheid i Sydafrika och Pinochetregeringen i Chile samt uppbackningen av frigörelse från kolonialväldena står mycken tvetydighet eller värre i andra fall . (SvD Ledare)

Derivations of proper nouns (DC) A derivation is not usally written with a capital letter even though the original proper noun is.

01 lower case letter => upper case letter

... den omtalade elli ottska rävfarmen ... /

... den omtalade Elli ottska rävfarmen ... (SvD Kultur)

02 upper case letter => lower case letter

Nu är Wayne Roques i Stockholm för att ge sina argument mot legaliseringen på konferensen Svensk narkotikapoliti k i ett Europeiskt perspektiv. / Nu är Wayne Roques i Stockholm för att ge sina argument mot legaliseringen på konferensen Svensk narkotikapoliti k i ett europeiskt perspektiv. (GS5A)

Personal titl es (PT) Titles normally take a lower case initial, but there are instances where proof-readers have changed a lower case letter to an upper case letter.

Page 20: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 9 –

01 lower case letter => upper case letter

… professor Sören Berg. / … Professor Sören Berg. (UNT 970419 Uppsala)

02 upper case letter => lower case letter

Fallet Silj e har nått ända till Seargent Steve Stonehill , Merseyside Police i Liverpool, och han hittar egentligen inga viktiga likheter mellan fallen. / Fallet Silj e har nått ända till seargent Steve Stonehill , Merseyside Police i Liverpool, och han hittar egentligen inga viktiga likheter mellan fallen. (GS6A)

Foreign names (FT) Titles of conferences, plays, etc written in English ought to follow language rules for English and not Swedish, which means that every content word in titles should be written with a capital letter and not the first word only. All foreign names and terms with capital letter problems are dealt with here, since they are not ordinary words in Swedish. The appropriateness of mixing another language and its norms into a Scandinavian proof-reading system is a matter of discussion, but never the less foreign words and expressions (especially English ones) are not uncommon in Swedish newspaper articles.

01 lower case letter => upper case letter

Han är oerhörd glad över bildandet av European cities against drugs (ett initiativ av Stock-holms förra finansborgarråd Carl Cederschiöld). / Han är oerhörd glad över bildandet av European Cities Against Drugs (ett initiativ av Stock-holms förra finansborgarråd Carl Cederschiöld). (GS5BC)

02 upper case letter => lower case letter

– Nej, men jag tycker min musik är Hard Listening, ha! – Nej, men jag tycker min musik är Hard listening, ha! (SvD Kultur)

4.1.2 Word Formation Err ors (WF)

Word formation errors are more or less restricted to compounding errors, for instance problems with binding morphemes and hyphens. Other subcategories deal with split words (two or more words should be written together as one word), concatenated words (one word should be written as two or more separate words), misplaced space (a space should be moved, not removed as in split words, or inserted as in concatenated words), and coordination with a common word part (erroneous hyphenation when coordinating shared word). Problems with abbreviations form a separate subcategory. Hyphens are seen as parts of words. Colon and apostrophs may also be included in the words. Colon may stand between an abbreviation and its inflection, and apostroph may signal the genitive form. Errors involving these signs when they are used for other purposes and thus not being a part of a word are not word formation errors, but punctuation problems or graphical problems along with problems with other signs. Problems in choosing the proper word form is not a word formation error; it is either a style problem (when two forms are correct but one is preferred over the other) or a grammar problem (when the context within the sentence decides which form to use).

Binding -s- missing (SM) When concatenating two words into a compound, an s is often needed between the words.

Norrmän och danskar brukar anse att svenskarna har storebrorfasoner, att vi inte anstränger oss lika mycket för att samtalspartnern ska förstå. / Norrmän och danskar brukar anse att svenskarna har storebrorsfasoner, att vi inte anstränger oss lika mycket för att samtalspartnern ska förstå. (GS18ABC)

Page 21: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 10 –

Binding -s- incorrect (SI) A concatenation has been made with an erroneous binding s which thus should be removed. If the binding s should be replaced by a hyphen, the error belongs to the next subcategory: hyphen missing.

Eddie Irvine ligger tvåa när han går i depå för däcksbyte och bränslepåfyllning. / Eddie Irvine ligger tvåa när han går i depå för däckbyte och bränslepåfyllning. (SvD Sport)

Hyphen missing (HM) In other cases, a hyphen should be put between the two words. A further specification is made based on the existence of an incorrect binding s or a capital letter problem. When a hyphen should be moved within a word, the problem is dealt with as one error belonging to this subcategory.

01 without an incorrect binding -s- and capital letter problem

... några enstaka funktioner, exempelvis se kurserna på New Yorkbörsen. /

... några enstaka funktioner, exempelvis se kurserna på New York-börsen. (MS54)

02 with an incorrect binding -s-

Vid Jarl Hjalmarsonsstiftelsens nyligen avhållna seminarium i Stockholm var besvikelsen bland de baltiska deltagarna tydlig. / Vid Jarl Hjalmarson-stiftelsens nyligen avhållna seminarium i Stockholm var besvikelsen bland de baltiska deltagarna tydlig. (CS1)

03 with capital letter problem

Saltsjöboo / Saltsjö-Boo (UNT 970502 Familj enytt)

04 hyphen to be moved

mag-tarmkanalen / magtarm-kanalen (UNT 970414 Debatt)

Hyphen incorrect (HI) Sometimes a hyphen is put between concatenated words where there should be no hyphen. Capital letter problems may occur together with erroneous hyphenation in compounds, a problem addressed on the specification level. Occasionally, when a binding hyphen is removed, a consonant is tripled and one of them is to be removed.

01 without capital letter problem

Boston-forskarna har även identifierat ett ämne som produceras av ursprungstumören och som i djurförsök visat sig kunna förhindra uppkomsten av metastaser. / Bostonforskarna har även identifierat ett ämne som produceras av ursprungstumören och som i djurförsök visat sig kunna förhindra uppkomsten av metastaser. (GS16A)

02 with capital letter problem

fastlands-Kina / Fastlandskina (UNT 970220 Uppsala)

03 consonant to be removed

cigarett-tändare / cigarettändare (UNT 970410 För Dagen)

Page 22: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 11 –

Split words (SW) A split word error occurs when several words ought to be written together as one word. The error specification specifies how many words to be concatenated. Whether the words may appear on their own or not is also taken into consideration on the specification level. In certain cases, the concatenation should be made by replacing the space with a hyphen.

01 2 lexical words

– I och med den fruktansvärda katastrofen som jag har gått i genom har jag också fått en erfarenhet som jag kan använda mig av. / – I och med den fruktansvärda katastrofen som jag har gått igenom har jag också fått en erfarenhet som jag kan använda mig av. (GS4BC)

02 3 lexical words

Där i genom bli r det omöjli gt för någon annan att döma pojkarna. / Därigenom bli r det omöjli gt för någon annan att döma pojkarna. (GS6BC)

04 2 words – at least one word is non-lexical

Läkaren fastslo g att brännmärkena hade orsakats genom tortyr. / Läkaren fastslog att brännmärkena hade orsakats genom tortyr. (SvD Inrikes)

12 2 words – at least one needs correction

hip hopare / hiphoppare (UNT 970421 Nöje)

05 2 lexical words + a hyphen after the first word or before the second word

parad- exempel / paradexempel (UNT 970430 Signerat)

20 -talet / 20-talet (UNT 970417 Uppland)

08 2 lexical words + a hyphen between them

facklig - politi sk samverkan / facklig-politi sk samverkan (UNT 970415 Debatt)

10 2 words + hyphen removed in the last word

Vill an i Totebo var helt övertänd när brandkåren var på plats vid halv fyra-tiden. / Vill an i Totebo var helt övertänd när brandkåren var på plats vid halvfyratiden. (SvD Inrikes)

09 2 words + capital letter problem

... i Förstamaj demonstrationen i Östervåla. /

... i förstamajdemonstrationen i Östervåla. (UNT 970502 Uppland)

07 compound with hyphen – common word

Det innebär fem sex procent, ungefär. / Det innebär fem-sex procent, ungefär. (SvD Inrikes)

Page 23: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 12 –

03 compound with hyphen – proper noun

... den anständiga, toleranta och allmänt humana ateism som vi finner hos en Bertrand Russell , en Jean Paul Sartre eller en Ingemar Hedenius, för att nu ta tre varianter, ... / ... den anständiga, toleranta och allmänt humana ateism som vi finner hos en Bertrand Russell , en Jean-Paul Sartre eller en Ingemar Hedenius, för att nu ta tre varianter, ... (CS3)

11 compound with hyphen + capital letter problem

Drive in-besiktning / drive-in-besiktning (UNT 970427 Ettan)

06 compound with hyphen – with figures, abbreviations etc

Som grund för beslutet ligger en studie där barnhälsovården i Uppsala gått igenom alla avvik-elser som hittats på en hel årskull 1,5 åringar satt i relation till den grupp som diagnostiserat fynden. / Som grund för beslutet ligger en studie där barnhälsovården i Uppsala gått igenom alla avvik-elser som hittats på en hel årskull 1,5-åringar satt i relation till den grupp som diagnostiserat fynden. (SvD Inrikes)

Concatenated words (CW) The opposite of the split words subcategory is the concatenated words subcategory: one single word should be divided into several words. When abbreviations are formed incorrectly with a missing space, the error falls within the abbreviations subcategory. The specifications concern how many words the erroneous word consists of, if there are any other problems in the concatenated word, and what type of words that are involved.

01 2 words – both correct

Den estniska regeringen har hittill s inte tagit ställning ifrågan. / Den estniska regeringen har hittill s inte tagit ställning i frågan. (GS2A)

09 3 words – all correct

... och förklarade vidare att "hur vi framstår spelar egentligen inte så stor roll l ängre eftersom vi iallafall kommer att få sparken och sedan hamnar vi i helvetet och får leva på äppelskrutt i evighet som hämnd för att vi lät oss luras av den där ormen för länge sedan". / ... och förklarade vidare att "hur vi framstår spelar egentligen inte så stor roll l ängre eftersom vi i alla fall kommer att få sparken och sedan hamnar vi i helvetet och får leva på äppelskrutt i evighet som hämnd för att vi lät oss luras av den där ormen för länge sedan". (SvD Kultur)

02 2 words – one word needs correction

De exempellösa ekonomiska framgångar som snabbt lyfte Japan till positionen som världens näst starkaste ekonomi kom självfallet också att högst avsevärt stärka LPD:ställning och göra väljarna mer benägna att överse med en tvivelaktig politi sk moral. / De exempellösa ekonomiska framgångar som snabbt lyfte Japan till positionen som världens näst starkaste ekonomi kom självfallet också att högst avsevärt stärka LPD:s ställning och göra väljarna mer benägna att överse med en tvivelaktig politi sk moral. (UNT 961022 Ledare)

04 2 words – with figures, letters etc

Kl 14.00100 milj oner transistorer på en ... / Kl 14.00 100 milj oner transistorer på en ... (UNT 970419 Uppsala)

Page 24: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 13 –

07 2 words – foreign words

Varför inte en performance eller standup: / Varför inte en performance eller stand up: (SvD Kultur)

Words with common word parts form a separate subcategory in which problems with hyphens are addressed. Problems with missing space, however, belong here.

05 words with a common word part

Det menar gatu-och fastighetskontoret. / Det menar gatu- och fastighetskontoret. (SvD Stockholm)

Erroneous hyphens are also addressed. The hyphen should be replaced by a space. The type of words involved is taken into consideration. For an expression to be labelled proper noun, at least one of the words should be a proper noun.

03 erroneous compound with a hyphen – proper noun

Men också förklara konsekvenserna av den politi k som Maj-Britt Theorin, Per Gahrton och Jörn Svensson företräder. / Men också förklara konsekvenserna av den politi k som Maj Britt Theorin, Per Gahrton och Jörn Svensson företräder. (CS1)

06 erroneous compound with a hyphen – common word

Det är mycket kvar att göra med just den formen, kanske vi kan hålla på fyra-fem år till . / Det är mycket kvar att göra med just den formen, kanske vi kan hålla på fyra fem år till . (SvD Kultur)

10 erroneous compound with hyphen – comma to be inserted

Gruppspykologi-dynamik och ... / Gruppspykologi, dynamik och ... (UNT 970429 Debatt)

08 other

KS har inget eget kapital trots att det normala för ett sjukhus bör vara att 50av till gångarna finansieras med egna medel. / KS har inget eget kapital trots att det normala för ett sjukhus bör vara att 50 procent av till -gångarna finansieras med egna medel. (SvD Stockholm)

Misplaced space (MS) When a space should be moved, not inserted or removed, the error falls within the misplaced space subcategory. No specification is made.

Den so mbara .../ Den som bara ... (UNT 970306 Kultur)

Coordination with common word part (CO) Hyphens can also be used when coordinating two words ending in (or beginning with) the same word, which then can be replaced with a hyphen in the first (or last) compound. Problems with missing space are addressed in the concatenated words subcategory.

01 hyphen missing

Där finner man bland annat: tidigarelagd momsinbetalning, återinförd rätt till blockad mot enmans och familj eföretag, höjda arbetsgivaravgifter och återinförd facklig vetorätt mot anlitande av entreprenörer. /

Page 25: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 14 –

Där finner man bland annat: tidigarelagd momsinbetalning, återinförd rätt till blockad mot enmans- och familj eföretag, höjda arbetsgivaravgifter och återinförd facklig vetorätt mot anlitande av entreprenörer. (UNT 961023 Ledare)

02 incorrect hyphen; no common part exists

Några av grundkurserna, som i matematik- och engelska, ges i tre olika hastigheter. / Några av grundkurserna, som i matematik och engelska, ges i tre olika hastigheter.(GS25ABC)

03 misplaced hyphen

Däremot visar inte studien, olikt andra liknande undersökningar, något samband mellan födelselängd- och vikt och bröstcancer. / Däremot visar inte studien, olikt andra liknande undersökningar, något samband mellan födelselängd och -vikt och bröstcancer. (SvD Inrikes)

04 space to be removed

Det är därför en trygghet att veta att socialstyrelsen när som helst kan få besked om var gränslinjen går genom att anmäla frågan till prövning av hälso - och sjukvårdens ansvars-nämnd. / Det är därför en trygghet att veta att socialstyrelsen när som helst kan få besked om var gränslinjen går genom att anmäla frågan till prövning av hälso- och sjukvårdens ansvars-nämnd. (UNT 961022 Debatt)

05 space to be moved

pappers -och massaindustrin / pappers- och massaindustrin (UNT 970306 Nöje)

Abbreviations (AB) When a word or an expression is incorrectly abbreviated, the error belongs in this subcategory. Choice between correct abbreviated forms is dealt with in the style, meaning, and reference group. No specification is made.

Som exempel kan nämnas att ca en tredjedel av de studenter som fram tom 1992 gick ut från ingenjörsprogrammen vid högskolan i Halmstad i dag har startat nya företag. / Som exempel kan nämnas att ca en tredjedel av de studenter som fram t o m 1992 gick ut från ingenjörsprogrammen vid högskolan i Halmstad i dag har startat nya företag. (UNT 961023 Debatt)

Other word formation errors (OP) Other word formation errors that do not fit in any of the subcategories above belong in this subcategory. This group might be divided into new subcategories or into specifications if that is appropriate.

Vinden spelade oss ett spratt och vi fick kryssskota. / Vinden spelade oss ett spratt och vi fick krysskota. (SvD Sport)

4.1.3 End of L ine Hyphenation Err ors (HY)

There are two main rules for end of line hyphenation in Swedish. The hyphen should be put either at a morpheme boundary or so that the new line starts with one consonant immediately followed by a vowel. The former will be called the morpheme boundary rule and the latter the one consonant rule. The rules complement each other, and they have exceptions. For example, the morpheme boundary rule should not be applied if the result would be that one character stands alone on one of the lines. The one

Page 26: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 15 –

consonant rule makes exceptions primarily based on pronounciation, so that characters forming a single sound should not be separated from each other. How the rules and their exceptions are applied varies not only between newspapers, but to some extent even between proof-readers. What some persons perceive as improper, other persons find acceptable. Moreover, the newspaper norms are not always in accordance with the recommendations from Svenska språknämnden. The subcategories express the proper way to make the end og line hyphenation, and the specifications state what rule has been violated.

Proper according to the morpheme boundary rule and to the one consonant rule (MC) After correction the end of line hyphenation is proper to both rules.

01 improper to the morpheme boundary rule and the one consonant rule

minne-svårdar / minnes-vårdar (GS2C)

Proper according to the morpheme boundary rule only (MB) Breaking the morpheme boundary rule can be done in different ways or be dependent on certain complicating circumstances such as the existence of a binding s, the next morpheme begins with an s, or the first morpheme ends with the same letter as the next morpheme begins with. No specification is however made.

01 improper to the morpheme boundary rule and the one consonant rule

des-truktiva / de-struktiva (UNT 970419 Nöje)

02 improper to the morpheme boundary rule only

veders-tyggligt / veder-styggligt (CS3)

03 improper to the one consonant rule only

koop-erativa / ko-operativa (UNT 970410 Uppland)

Proper according the one consonant rule only (CR) Some words have to break the morpheme boundary rules when inserting an end of line hyphenation. Depending on which rules the erroneous hyphenation is violating, the error is specified in one of three alternatives just as in the previous subcategories.

01 improper to the morpheme boundary rule and the one consonant rule

re-glerna / reg-lerna (GS14C)

02 improper to the one consonant rule only

klock-or / kloc-kor (GS12C)

Proper according to pronounciation and other problems (PR) There is a ”rule” stating that it is not appropriate to split a sequence of letters representing a single sound. Violations of this norm fall within the present subcategory. There is also a rule stating that the removed consonant in a compound must be reinserted if the compound is separated on two lines (see the example in 02).

Page 27: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 16 –

01 violation to pronounciation

männis-kor / männi-skor (GS14C)

02 consonant to be inserted

till -ämpat / till -lämpat (UNT 961024 Uppland)

03 end of line hyphenation removed

as-pekt / aspekt (UNT 970505 Kultur)

04 other problems

histori-ens / histor-iens (UNT 970430 Signerat)

4.1.4 (Other) Spelli ng Err ors (OS)

Capital letter errors and word formation errors can be perceived as spelli ng errors, maybe based on insuff icient language competence rather than language performance. The (other) spelli ng errors category contains both competence and performance errors, but the subcategorisation is not based on such a division since it would be diff icult to classify many of the errors in these terms. Instead, the subcategories are based on the types of words in which the errors occur: proper nouns, foreign words, number expressions, and other words. If an error does not fit in one the first three subcategories, then it belongs to the last one.

Proper nouns (PN) All spelli ng errors occurring in proper nouns (except capital letter errors) are covered in this subcategory.

Sverige röstade i veckan för förslaget på WHO:s årliga möte i Geneve. / Sverige röstade i veckan för förslaget på WHO:s årliga möte i Genève. (RSN9)

Foreign words (FW) Not only Swedish words and expressions are used in Swedish texts. There is no further specification concerning what languages the misspelled words belong to, nor what type of words that are misspelt.

Prudential har kvar Forcenergys amerikanska intressebolag Forcenergy Gas Exploration som "singel best idea", enligt Bloomberg Business News. / Prudential har kvar Forcenergys amerikanska intressebolag Forcenergy Gas Exploration som "single best idea", enligt Bloomberg Business News. (RSN4)

Number expressions (NB) When a date has been misspelt, for instance a letter has accidently been written instead of a digit, the error belongs to this number expression subcategory.

Prytz sväljer t ex en uppgift, att Grönland nämns som en del av Hamburgs ärkestift i ett påve-brev B31 – alltså en mansålder innan Island var känt – under lakonisk hänvisning till ”Norden-skiöld 1883” . / Prytz sväljer t ex en uppgift, att Grönland nämns som en del av Hamburgs ärkestift i ett påve-brev 831 – alltså en mansålder innan Island var känt – under lakonisk hänvisning till ”Norden-skiöld 1883” . (CS5)

Page 28: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 17 –

Other words (OW) This subcategory is where the majority of the spelli ng errors end up. No further specification is made between for example word categories or types of misspelli ng (substitution, deletion, transposition, etc, of characters in the word).

Här finns berg och vatten och inte minst suveräna träningsförhålladen. / Här finns berg och vatten och inte minst suveräna träningsförhållanden. (RS32)

Page 29: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 18 –

4.2 Grammar Problems (GP)

A grammar problem involves more than one typographical word but is limited to the sentence. The grammatical errors have primarily been categorised according to a phrase grammar approach rather than a functional one, since the future usage of the typology will be based on phrase grammar. The grammar checker is to recognise phrase constituents, and it will probably not be able to establish all the relations between the phrases in a particular sentence. As a consequence, the notion of verb phrase is of less importance when classifying grammatical errors. The verb phrase is, however, used in a limited sense, as a sequence of verbs. Another verb related category is concerned with problems in verb valency – what complements a verb can take including verb governed prepositions and adverbs. The main idea has been to create categories on sentence or clause level, so that sentence level phenomena constitute categories, and phrase level phenomena constitute subcategories within the categories. A phrase that occurs on sentence level will make a category of its own, while a word category most often is part of a phrase. The word category will t hus constitute a subcategory within the phrase category. For example, the noun phrase appears on the top level and is thus a category; problems concerning pronoun case in pronouns functioning as clause constituents are also grouped in a category. The categories in the grammar problems group are the following:

· Noun Phrase (NP)

· Adjective Phrase (AP)

· Adverb Phrase (AB)

· Prepositional Phrase (PP)

· Conjunctions and Conjunctive Adverbs (CN)

· Verb Phrase in the Limited Sense (VF)

· Verb Valency (VV)

· Pronoun Case (PC)

· Agreement (AG)

· Referential Problems (RP)

· Word Order (WO)

· Wrong Word Category (WC)

· Other Grammar Problems (OG) One problem that immediately arises is the prepositional phrase (PP) attachment ambiguity – is the PP a postmodifier to a previous noun or is it a clause constituent of its own? The answer to such a question is dependent on the grammatical analyses made of the sentence. When the choice of preposition is governed by the previous noun, the problem is seen as a noun valency problem belonging to the noun phrase category. The same valency problems may occur after adjectives and verbs, and the errors are considered within the adjective phrase category and the category of the verb phrase in the limited sense, respectively. All other problems with prepositional phrases fall i n the PP category, for instance when the choice of preposition is dependent on a following word, often a noun, or on a semantic entity. When the proof-reader prefers one preposition over another but both are correct, the problem is considered to be a style problem belonging to the style, meaning, and reference group. The adjective phrase (AP) is both a category of its own and a subcategory of the noun phrase (NP) cate-gory. In the former case, the AP functions as a complement and is not part of a hierarchially supreme phrase category, while in the latter case it is a modifier within an NP. A similar approach has been taken towards agreement errors. Within the NP, agreement errors will be quite easily detectable for the grammar checker, but on clause level agreement problems may be more diff icult to recognise. According to the underlying idea of separating phenomena at different levels and taking the probable performance of the grammar checker into account, agreement errors will form both a

Page 30: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 19 –

subcategory of the NP category and a category of its own. The same goes for word order errors, which can occur at any level in the sentence. Even though conjunctions and conjunctive adverbs hardly could be seen as constituting phrases, they form a category dealing with erroneous constructions dependent on the use of conjunctions and conjunc-tive adverbs. The category is relevant only for problems occurring on sentence or clause level, while erroneous use of conjunctions as parts of noun phrases, for instance, are dealt with in the noun phrase category. Erroneous usage of certain discontinous conjunctional expressions (such as varken … eller…, såväl … som …) is also gathered in the category of conjunctions and conjunctional adverbs. If there are difficulties in establishing what parts of the sentence that are coordinated, the problem will fall i n the other grammar problems category. Referential problems concern errors in use of pronouns referring to an antecedent within the same sentence. When the correction of an error involves changing word category, the error will be labelled wrong word category. This error type occurs both as subcategories or specifications within the phrase categories, and as a category on a higher level. The latter category addresses the issue of recognising erroneous sequences of word categories on clause or sentence level. If the erroneous word is part of a phrase, the problem will be handled within the proper phrase category. If a word should be replaced by another word in the same word category, the error belongs to the style, meaning, and reference group. The last category in the grammar problems group contains problems that fall outside the other categories but are still grammar problems, such as doubled multiword expressions.

4.2.1 Noun Phrase (NP)

Within the noun phrase, there are two main types of problems: agreement errors and usage problems. Agreement concerns the correspondence of a certain feature (gender, number, species) within the noun phrase. There are though well -formed noun phrases in which the words differ in species. Violations of these rules fall within the species category. However, if a problem may be analysed as an agreement error, this view is preferred over alternative analyses. To detect a usage error and to know how to correct it usually involve information given outside the noun phrase. Despite this, usage problems concerning number and species belong to the noun phrase category. Usage of articles is included in the species category, because there are errors that may be corrected in two different ways: changing the species or inserting an article. Species problems in noun phrases functioning as complements to prepositions are also addressed here. Prepositional phrases are primarily not perceived as parts of noun phrases, but noun valency errors belong to the noun phrase category. That is, problems in choosing the correct preposition are dealt with in this category rather than in the prepositional phrase category if the choice is governed by a noun outside the prepositional phrase. There is a note to be made about the used terminology. The term premodifier is used for the sequence left of the head word, and the term postmodifier denotes the attribute following the head word of the phrase.

Agreement (AG) Agreement errors concern the features of number (the singular, the plural), gender (the neuter, the non-neuter) and species (the indefinite, the definite) primarily between premodifier and head noun, but also between noun and postmodifier. Correction of an agreement error may be made in different ways and is not taken into consideration on the specification level. There are problems that could be treated as agreement errors but are not. Two of these problems concerns the type of gender to govern the noun phrase (grammatical or semantic gender), and to chose the proper word to govern the gender of articles. Another problem occurs when a word or an expression has a plural meaning but is in the singular form. The former problems are accounted for in the gender subcategory, while the latter problem is dealt with in the number subcategory. In all other cases, when recognition of a problem may be made by detecting an agreement error, it is an agreement error. However, agreement errors in headings between a noun and what might be a postmodifier are conceived as agreement errors on clause levels as if the copulas have been left out. Agreement errors involving the number feature:

01 number agreement in premodifier - noun

Samtidigt till sätter regeringen ett etiskt råd med präster, psykologer och andra yrkesgrupper med bred mänsklig erfarenheter. / Samtidigt till sätter regeringen ett etiskt råd med präster, psykologer och andra yrkesgrupper med bred mänsklig erfarenhet. (GS2ABC)

Page 31: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 20 –

Poliserna från Clark County Sheriffs department fann marijuana i fickan på ett byxor och heroin i en ballong. / Poliserna från Clark County Sheriffs department fann marijuana i fickan på ett par byxor och heroin i en ballong. (SvD Sport)

05 number agreement in coordinated head nouns

Biskopen levde 200 år senare, med 1500-talets vyer och antagande till förfogande. / Biskopen levde 200 år senare, med 1500-talets vyer och antaganden till förfogande. (CS5)

06 number agreement in coordinated nouns in the genitive

Det behöver inte betyda att Gud måste antas ingå i tidernas och rummets sammanhang, för att kunna diskuteras rationellt , men snarare något i stil med det första av de tre postulat som Hede-nius ställde upp i ”Tro och Vetande” och kallade ”Det religionspsykologiska postulatet” (de två andra var det språkteoretiska och det logiska: ...). / Det behöver inte betyda att Gud måste antas ingå i tidens och rummets sammanhang, för att kunna diskuteras rationellt , men snarare något i stil med det första av de tre postulat som Hede-nius ställde upp i ”Tro och Vetande” och kallade ”Det religionspsykologiska postulatet” (de två andra var det språkteoretiska och det logiska: ...). (CS3)

07 number agreement head noun – pronoun as postmodifier

På Eriksdalsvill an städar personalen själva. / På Eriksdalsvill an städar personalen själv. (SvD Stockholm)

08 number agreement in noun phrases in apposition

... med en för oss rikssvenska ibland främmande begreppsvärld. /

... med en för oss rikssvenskar ibland främmande begreppsvärld. (UNT 970219 Kultur)

Agreement errors involving the species feature:

03 species agreement in premodifier – noun

Polisen avblåser nu den stora brottsutredning. / Polisen avblåser nu den stora brottsutredningen. (GS11A)

Ungdomen har i betydligt utsträckning än övriga accepterat ... / Ungdomen har i betydligt större utsträckning än övriga accepterat ... (UNT 970219 För Dagen)

11 species agreement in premodifier – coordinated nouns

Aftonbladets ledarsida drabbades i helgen av akut sjukdomsinsikt beträffande svenska ekonomi och arbetsmarknad. / Aftonbladets ledarsida drabbades i helgen av akut sjukdomsinsikt beträffande svenska ekonomin och arbetsmarknaden. (SvD Ledare)

10 species agreement in premodifier – adjective functioning as a noun

- Stockholms geografiska läge är inte det lämpligast för sjöfart. / - Stockholms geografiska läge är inte det lämpligaste för sjöfart. (SvD Stockholm)

Agreement errors involving the gender feature:

Page 32: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 21 –

02 gender agreement in premodifier – noun

Så en eventuellt segerfest får vänta till måndag kväll , slutar Erik. / Så en eventuell segerfest får vänta till måndag kväll , slutar Erik. (RS32)

04 gender agreement in noun – relative pronoun

Gruppens eget varv i Odense är i färd med att bygga tolv av världens största containerfartyg, var och en med en kapacitet på över 6 000 TEU (ett tal som anger antalet containrar som ett fartyg att transportera). / Gruppens eget varv i Odense är i färd med att bygga tolv av världens största containerfartyg, vart och ett med en kapacitet på över 6 000 TEU (ett tal som anger antalet containrar som ett fartyg att transportera). (RSN4)

09 gender agreement in premodifier – adjective / participle functioning as a noun

Det allvarligaste skadade, en 17-åring med gitarrspel och ishockey som största intressen, satt med röret i knät när blandningen briserade. / Den allvarligaste skadade, en 17-åring med gitarrspel och ishockey som största intressen, satt med röret i knät när blandningen briserade. (SvD Inrikes)

13 gender agreement in noun – postmodifier

Två beslag på vardera två kilo ... / Två beslag på vartdera två kilo ... (UNT 970423 Ettan)

Other agreement errors:

12 agreement in coordinated nouns

Om man pålar grunden och bygger in konserthallen i ett "innerskal" av lätt konstruktion så kommer ljud och vibrationerna att hamna under till ämpliga riktvärden. / Om man pålar grunden och bygger in konserthallen i ett "innerskal" av lätt konstruktion så kommer ljud och vibrationer att hamna under till ämpliga riktvärden. (UNT 970306 Uppsala)

Nackdel och riskerna är att ... / Nackdelarna och riskerna är att ... (UNT 970219 Ledare)

Gender (GE) Even though gender is an inherent feature, there are problems in when to use the semantic gender (the masculine / the feminine) instead of the grammatical (the neuter / the non-neuter), and vice versa.

01 grammatical gender versus semantic gender

… hennes döda make … / … hennes döde make … (UNT 970307 För Dagen)

Gender agreement rules are set aside when the premodifer is of a certain type. The gender of the article is governed by the premodifying noun instead of by the head noun of the phrase.

02 wrong gender of the indefinite article in genitive premodifier

… en slags tvångsförvaltning …/ … ett slags tvångsförvaltning … (UNT 970415 Uppland)

Page 33: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 22 –

Number (NB) Some words and expressions have one grammatical number but another semantic number. These problems are addressed in the number subcategory along with problems in choosing the proper number. Another problem involves diff iculties in deciding whether to perceive a word as an uncountable or not. A noun in the singular without the indefinite article is often erroneous. The problem may be delat with in three different ways, one of which involves changing the number frpn the singular to the plural. The other two ways involves changing the species and these solutions are addressed in the species subcategory.

01 the plural => the singular

... andra arter av sjöfåglar har minskat ... /

... andra arter av sjöfågel har minskat ... (UNT 970408 Uppland)

04 the singular => the plural

Det tidstypiska tornet var på modet under sent 1800-tal där dåtida sjöman ... / Det tidstypiska tornet var på modet under sent 1800-tal där dåtida sjömän ... (UNT 970429 Ettan)

02 number problems between premodifier - noun: uncountable / countable

... får han mycket frågor om badkar ... /

... får han många frågor om badkar ... (UNT 970417 Tema)

03 semantic number different from grammatical number

Milit ärligan, som kunde gripas utanför Sala efter ett rån i Heby i Uppland dagen före julafton 1993, ligger bakom en serie grov brottslighet som i Sverige helt saknar motstycke. / Milit ärligan, som kunde gripas utanför Sala efter ett rån i Heby i Uppland dagen före julafton 1993, ligger bakom en serie grova brott som i Sverige helt saknar motstycke. (GS23A)

Species (SS) Usage of the definite and the indefinite forms and articles are the problems dealt with in the species subcategory. Not seldom it is diff icult to separate between a definite article and a demonstrative pronoun with the same orthography. The distinction is not made – a demonstrative pronoun is a potential article and vice versa. There are cases in which article usage is a stylistic issue rather than a grammatical one: before dates. Problems of this kind is addressed in the number style category in the style, meaning, and reference group. The context outside the noun phrase has often an influence on the choice of species and article. In spite of this, it has not been included as a parameter on the specification level since it goes beyond the noun phrase. However, including a context dimension would be an interesting expansion of the typology. A noun phrase consisting of an adjective and a noun in the definite form might be erroneous. This error may be corrected either by inserting the definite article or by changing the species to the indefinite form. The error is specified with the 01 code. No division is made between the two correction alternatives since the focus of the typology is on recognising errors rather than on different ways of correcting them.

01 definite article missing or erroneous definite inflection in definite noun phrase with adjective attribute

Processionen, som rullar fram i 30 kilometers hastighet, och kylbilen med finska, estniska och svenska flaggorna fasttejpade på sidorna, för genast tankarna till baka till katastrofen. / Processionen, som rullar fram i 30 kilometers hastighet, och kylbilen med de finska, estniska och svenska flaggorna fasttejpade på sidorna, för genast tankarna till baka till katastrofen. (GS12ABC)

Page 34: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 23 –

... utan går till närmaste Konsumbutiken när han ska köpa ... /

... utan går till närmaste Konsumbutik när han ska köpa ... (UNT 970415 Ettan)

If the noun is preceeded by a genitive attribute, the noun should be in the indefinite form. This problem is labelled 02. Normally, the error is corrected by removing the definite inflection of the head noun.

02 erroneous definite inflection after genitive attribute

I dagarna har halva regeringens mandatperioden passerat, det är nu knappt 700 dagar kvar till nästa val. / I dagarna har halva regeringens mandatperiod passerat, det är nu knappt 700 dagar kvar till nästa val. (UNT 961023 Ledare)

A noun phrase in the indefinite form singular without the article is often erroneous. The phrase could be corrected in three ways: change the species, change the number, or insert the article. The first and the third alternatives are classified in the species subcategory (specification 03), while the second alternative belongs to the number subcategory. It might be the case that the noun phrase functions as the complement in a prepositional phrase, and that this context influences the choice of species. The specification will then be 09. Other cases of missing definite inflection are gathered in the specification 12.

03 indefinite article missing or definite article (and definite inflection) missing in indefinite noun phrase in the singular without article

Äntligen kvinnlig biskop? / Äntligen en kvinnlig biskop? (UNT 970412 Ledare)

Men allt överskuggande problem för Samhall nu och under överskådlig tid är den höga arbets-lösheten i Sverige. / Men det allt överskuggande problemet för Samhall nu och under överskådlig tid är den höga arbetslösheten i Sverige. (SvD Näringsliv)

09 definite inflection missing in noun phrase in PP

Då hon reste sig igen, kastade hon av sig jackan, som blev liggande i en vattendamm på fotbollsplan. / Då hon reste sig igen, kastade hon av sig jackan, som blev liggande i en vattendamm på fotbollsplanen. (GS19A)

12 other cases of missing definite inflection

Det sade förre statsminister Ingvar Carlsson ... / Det sade förre statsministern Ingvar Carlsson ... (UNT 970502 Uppsala)

The head noun should be in the indefinite form, even though the premodifiers are in the definite form, if followed by a necessary relative clause. This exception to the agreement rules is signalled by the absence of a comma after the head noun. Errors of this type are specified with 04.

04 erroneous definite inflection before a necessary relative clause

Vi kan inte förvägra dessa länders medborgare den frihet, den säkerhet och de ekonomiska möjli gheterna som ett EU-medlemsskap skulle ge dem. / Vi kan inte förvägra dessa länders medborgare den frihet, den säkerhet och de ekonomiska möjli gheter som ett EU-medlemsskap skulle ge dem. (CS1)

Another exception of species agreement within the noun phrase occurs when a certain demonstrative pronoun (such as denna, detta, dessa) preceeds the head noun. The head noun should be in the indefinite form while the premodifer should be in the definite form. These errors are specified with 05. In specificaiton 10, erroneous definite inflections in titles are addressed. Other cases os erroneous definite inflections are gathered in the specification 11.

Page 35: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 24 –

05 erroneous definite inflection after certain pronouns and adjectives

Tio milj oner kostar denna försöksverksamheten med förarlösa spårbundna bussar. / Tio milj oner kostar denna försöksverksamhet med förarlösa spårbundna bussar. (UNT 961022 Debatt)

... nästa veckan på Jägersro ... /

... nästa vecka på Jägersro ... (UNT 970502 Sport)

10 erroneous definite inflection in titles

Skolministern Ylva Johansson hade dock tackat nej ... / Skolminister Ylva Johansson hade dock tackat nej ... (UNT 970415 Ettan)

11 other cases of erroneous definite inflection

... påståenden om att intelli gensen främst skulle vara genetiskt betingad. /

... påståenden om att intelli gens främst skulle vara genetiskt betingad. (UNT 970417 Nöje)

There are instances in which articles should be removed. If it is a definite article, the error falls within the 06 specification. If it is an indefinite article, the 07 specification is the appropriate one. However, if the article is doubled, that is, if there is one article too many, the error belongs to the 08 specification (no distinction is made between the indefinite and the definite forms).

06 demonstrative pronoun / definite article should be removed

Förslaget, som kommer från personalen vid invandrarförvaltningen, innebär att den integra-tionsenheten startar 1 juli 1997. / Förslaget, som kommer från personalen vid invandrarförvaltningen, innebär att integrationsen-heten startar 1 juli 1997. (UNT 961025 Uppland)

07 the indefinite article should be removed

Men enligt en uppgift kommer Sala Allehanda ... / Men enligt uppgift kommer Sala Allehanda ... (UNT 970419 Uppland)

08 double articles

... hålla ihop den den disparata regeringskoaliti on han leder. /

... hålla ihop den disparata regeringskoaliti on han leder. (UNT 970418 Ledare)

Case (CA) The case subcategory contains problems concerning the case feature such as erroneous basic case in nouns, pronouns, and adjectives, and vice versa. There are, however, two problems that are classified elsewhere in the typology. First, when the case feature influences the choice of species it is considered to be a species problem. Second, when determining the pronoun case the function of the pronoun in the clause must be analysed. Therefore, problems in pronoun case belong to the category pronoun case. Two of the subcategories deal with missing genitive inflection, i.e. common nouns (01) and proper nouns (02) should be in the genitive case but are not.

01 common noun should be in the genitive case

Hos oss hörs inte tonåringar rop på hjälp. / Hos oss hörs inte tonåringars rop på hjälp. (RS24)

Page 36: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 25 –

02 proper noun should be in the genitive case

Troligen går du inte i land med att själv hitta några ätbara svampar i vår Herres hage och inte i Pettersson hage heller för den delen. / Troligen går du inte i land med att själv hitta några ätbara svampar i vår Herres hage och inte i Petterssons hage heller för den delen. (UNT 961023 Likt och Olikt)

Erroneous instances of the genitive case in which the noun should be in the basic case are addressed in the specification 03.

03 the genitive case => the basic case

Bertilsson får dock samma ekonomiska förmåner som alla riksdagsmäns som slutar – pension och inkomstgaranti. / Bertilsson får dock samma ekonomiska förmåner som alla riksdagsmän som slutar – pension och inkomstgaranti. (RS1)

Errors in forming the genitive case in nouns consisting of several words fall i n the specification 04.

04 error in forming of the genitive case in word group

Filosofen John N Findlay försökte på fyrtiotalet ett sådant generellt negativt gudsbevis, baserat på Anselms av Canterbury’s berömda ontologiska bevis i Proslogion III . / Filosofen John N Findlay försökte på fyrtiotalet ett sådant generellt negativt gudsbevis, baserat på Anselm av Canterburys berömda ontologiska bevis i Proslogion III . (CS3)

Possessive pronouns express the genitive case. Therefore, problems involving possessive pronouns are dealt with in the case subcategory rather than in the pronoun subcategory.

05 pronoun should be possessive pronoun

När Ivan Aguéli dog 1917 såg prins Eugen till att han efterlämnade målningar kom hem till Sverige. / När Ivan Aguéli dog 1917 såg prins Eugen till att hans efterlämnade målningar kom hem till Sverige. (RS23)

Adjectives used as nouns may also take the genitive case. These errors are addressed in the specification 06. The last specification addresses other problems with case.

06 adjective used as a noun should be in the genitive case

Den senare Vals i Valparaiso … / Den senares Vals i Valparaiso … (UNT 970422 Nöje)

07 other problems with case

... efter var och ens behov. /

... efter vars och ens behov. (UNT 970410 Ettan)

Adjective phrase (AP) The adjective phrase subcategory concerns the usage of adjective phrases excluding participles as attri-butes in noun phrases. Predicative usage of adjective phrases is covered in the adjective phrase category. Usage of participles in noun phrases is covered in a separate subcategory. Agreement errors concerning adjectives in noun phrases are dealt with in the agreement subcategory. Wrong word category in premodifiers of the head adjective in the adjective phrase is addressed here and not in the wrong word category since the error appears within a phrase rather than at the top level in the clause. The same goes for erroneous word category of the head adjective. Another problem is when the premodifier is an adverb but of the wrong type.

Page 37: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 26 –

01 wrong word category of the premodifier

Han påpekade att alla länder i Latinamerika utom Kuba nu har demokratisk valda regeringar. / Han påpekade att alla länder i Latinamerika utom Kuba nu har demokratiskt valda regeringar. (RS14)

04 wrong word category of the head adjective

De lever inte sällan isolerat och med lite insyn från andra. / De lever inte sällan isolerat och med liten insyn från andra. (UNT 970415 Debatt)

02 wrong type of adverb in premodifier

De bjuder på de vanliga och när oöverkomliga svårigheterna att centrala begrepp är så insmult-na i en hel li vsform att de i en kort artikel gäckar en läsare utan tidigare förtrogenhet med åskådningarna. / De bjuder på de vanliga och hart när oöverkomliga svårigheterna att centrala begrepp är så in-smultna i en hel li vsform att de i en kort artikel gäckar en läsare utan tidigare förtrogenhet med åskådningarna. (CS4)

When an adjective is used as a noun, it has to be in a proper form. If that is not the case, the problem falls in the adjective phrase subcategory.

03 adjective used as a noun

– Stockholms geografiska läge är inte det lämpligast för sjöfart. / – Stockholms geografiska läge är inte det lämpligaste för sjöfart. (SvD Stockholm)

05 other problems

... på grymmast möjli ga sätt ... /

... på grymmaste möjli ga sätt ... (UNT 970408 Ledare)

Participles (PE) Participles may be viewed either as verbs or as adjectives. In this subcategory of the noun phrase category, the focus is on participles that functions as attributes in noun phrases. For simplicity, all these participles are perceived as verbs. Cases in which a participle erroneously has become a verb in the past tense are not perceived as wrong category errors but as wrong verb form errors. All participles are not premodifiers of the noun. A participle may govern a postmodifier of the head noun as well .

01 wrong verb form in premodifier

Prytz är känd som författare med historiska romaner på meritli stan och imponerade beläsenhet och engagemang på det område han här återkommit till . / Prytz är känd som författare med historiska romaner på meritli stan och imponerande beläsen-het och engagemang på det område han här återkommit till . (CS5)

02 wrong verb form in postmodifier

... han är välkänd för oss genom många verk behandlade sådant som Östersjörummets kulturella ... / ... han är välkänd för oss genom många verk behandlande sådant som Östersjörummets kulturella ... (UNT 970219 Kultur)

Numerals (NL) The numerals subcategory deals with problems in numerals. A special case is when the numeral is missing in expressions such as en av.

Page 38: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 27 –

01 approximate number

Tillt agande våldsamma stormoväder kan bero på global uppvärmning, men nu får milj övänner oväntat stöd från ett 60 ledande försäkringsbolag ... / Tillt agande våldsamma stormoväder kan bero på global uppvärmning, men nu får milj övänner oväntat stöd från ett 60-tal ledande försäkringsbolag ... (SvD Utrikes)

02 numeral missing in certain expressions

En fattig nomadtjej som bli r av Sveriges mest firade artister vid 25 års ålder. / En fattig nomadtjej som bli r en av Sveriges mest firade artister vid 25 års ålder. (UNT 970306 Nöje)

03 wrong word category

Det är att av flera fall där sociala myndigheter har misslyckats med sina långvariga placeringar av barn i familj ehem. / Det är ett av flera fall där sociala myndigheter har misslyckats med sina långvariga placeringar av barn i familj ehem. (SvD Inrikes)

Nouns (NN) All of the other subcategories are dealing with nouns in some way. The nouns subcategory deals with the problem of missing nouns and wrong word category errors. When a word should be a noun but is not, and vice versa, the errors are classified in the category of wrong word category if there are signals that the erroneous word stands in a noun phrase. Otherwise, the error falls within the category that deals with wrong word category. The same principle governs the classification of doubled nouns. If there are no signs that it is anoun phrase, the error belongs to the category of other grammar problems.

01 head noun missing

Hans viktigaste är kanske att förespråkarna har så dåliga argument själva. / Hans viktigaste argument är kanske att förespråkarna har så dåliga argument själva. (GS5AB)

02 wrong word category

Europafrågan är bara en den av en hel uppsättning centrala framtidsfrågor där en skilj elinje mellan traditionalism och modernism löper tvärs igenom det socialdemokratiska partiet. / Europafrågan är bara en del av en hel uppsättning centrala framtidsfrågor där en skilj elinje mellan traditionalism och modernism löper tvärs igenom det socialdemokratiska partiet. (CS1)

03 doubled noun

- Vinner jag där går jag förmodligen mot Fili ppini i kvarten och honom brukar jag ha svårt för, säger den nytände svenske tennisstjärnan som redan för två år år sedan var i kvarten och med de bäste hemmaspelare. - Vinner jag där går jag förmodligen mot Fili ppini i kvarten och honom brukar jag ha svårt för, säger den nytände svenske tennisstjärnan som redan för två år sedan var i kvarten och med de bäste hemmaspelare. (SvD Sport)

Pronouns (PN) Pronouns may be of different types, but the specification is not made on that basis. Distinctions must be made between this pronoun subcategory within the noun phrase category and other categories in the typology addressing pronoun problems: – Erroneous usage of the impersonal det belongs to the verb valency category.

Page 39: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 28 –

– Pronoun case problems concerning the subjective and the objective case belong to the pronoun case category.

– Problems with possessive pronouns are dealt with in the case subcategory. – When the wrong pronoun is picked for referring to another noun phrase, the error belongs to the

referential problems category in the grammar problems group if the antecedant is in the same sentence as the pronoun, otherwise in the style, meaning, and reference group.

Pronoun problems are thus addressed in several places in the typology. This subcategory contains errors which cannot be considered as one of the problems mentioned above: missing pronouns, doubled pronouns, wrong type of pronoun, and wrong word category.

01 relative pronoun missing

Det blev en lugn aktion med poliser som kallats till platsen och frågade demonstranterna hur länge de tänkte hålla på. / Det blev en lugn aktion med poliser som kallats till platsen och som frågade demonstranterna hur länge de tänkte hålla på. (UNT 970304 Uppsala)

02 doubled pronoun

Men nu byter de de ganska radikalt stil och skruvar upp fuzzboxen på max. / Men nu byter de ganska radikalt stil och skruvar upp fuzzboxen på max. (SvD Kultur)

03 wrong type of pronoun

... en tjänst dom institutionssekreterare /

... en tjänst som institutionssekreterare (UNT 970430 Familj enytt)

04 wrong word category

... verkligheten bakom dras fåfänga yta. /

... verkligheten bakom deras fåfänga yta. (UNT 970505 Kultur)

05 other problems

Problemet idag är att ungdomarna måste gå igenom de har lektionerna även om de inte vill , fortsätter han. / Problemet idag är att ungdomarna måste gå igenom de här lektionerna även om de inte vill , fortsätter han. (SvD Stockholm)

Choice of preposition after a noun (CP) The error specification when choosing the correct preposition after a noun has been made according to complement types. This subcategory does also contain cases where no preposition is the correct choice. A doubled preposition, that is the same preposition is erroneously repeated, is a special problem dealt with in the specification 07, while two different preposition of which one should be removed is a problem belonging to the specification 09. Missing prepositions are dealt with in the next subcategory. Specifications addressing choice of preposition:

01 noun + preposition + NP

En förklaring till tendensen av ökat övertidsarbete kan vara en förskjutning av ambulans-förarnas arbetstid. / En förklaring till tendensen till ökat övertidsarbete kan vara en förskjutning av ambulans-förarnas arbetstid. (GS1ABC)

02 noun + preposition + infinitive phrase

Ett första möte med bostadslåneinstituten skall utgöra upptakten för att lösa de akuta ekono-miska problemen för dem som bor i vissa nyare bostäder. /

Page 40: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 29 –

Ett första möte med bostadslåneinstituten skall utgöra upptakten till att lösa de akuta ekono-miska problemen för dem som bor i vissa nyare bostäder. (GS14A)

10 noun + preposition + att-clause

De få studier som gjorts ger varierande svar, men Boston-gruppen anser att det finns indika-tioner för att mekanismen förekommer även för kvinnor före klimakteriet. / De få studier som gjorts ger varierande svar, men Bostongruppen anser att det finns indika-tioner på att mekanismen förekommer även för kvinnor före klimakteriet. (SvD Inrikes)

03 noun + preposition + subordinate clause

Den nytill satta statssekreteraren Lena Häll Eriksson skall i nom den närmaste tiden utarbeta ett förslag för hur alternativet nu skall se ut. / Den nytill satta statssekreteraren Lena Häll Eriksson skall i nom den närmaste tiden utarbeta ett förslag till hur alternativet nu skall se ut. (GS24ABC)

04 noun + PP + preposition + NP

Läkemedelsverket väntas därför ganska snart godkänna behandling med till växthormon på vuxna med sådan GH-brist. / Läkemedelsverket väntas därför ganska snart godkänna behandling med till växthormon av vuxna med sådan GH-brist. (GS8A)

Specifications addressing removal of preposition:

05 noun + infinitive phrase [no preposition]

Det ser vi tydligt i det momentum som vänstern i vid mening givits genom sin valframgång och i problemen i att till varata svenska intressen i EU genom nej-sidans kraftigt stärkta posi-tion i EU-parlamentet. / Det ser vi tydligt i det momentum som vänstern i vid mening givits genom sin valframgång och i problemen att till varata svenska intressen i EU genom nej-sidans kraftigt stärkta position i EU-parlamentet. (CS1)

06 noun + att-clause [no preposition]

Fullmäktige i Tierp har fattat ett principbeslut på att de mindre folkbiblioteken ska slås sam-man med skolbiblioteken. / Fullmäktige i Tierp har fattat ett principbeslut att de mindre folkbiblioteken ska slås samman med skolbiblioteken. (UNT 961023 Ettan)

08 noun + noun [no preposition]

Brukskapellet har spelat i Stockholm och även i vänorten i Åbo. / Brukskapellet har spelat i Stockholm och även i vänorten Åbo. (UNT 970424 Familj enytt)

Specifications addressing removal of superfluous preposition:

07 doubled preposition

Och i måndags försökte Storas advokat Alexander Riesenkampff övertyga rätten om att Stora inte har ansvar för för dotterbolagens olagliga prissamarbete med andra företag - vilket också är en fråga av viss principiell betydelse. / Och i måndags försökte Storas advokat Alexander Riesenkampff övertyga rätten om att Stora inte har ansvar för dotterbolagens olagliga prissamarbete med andra företag - vilket också är en fråga av viss principiell betydelse. (SvD Näringsliv)

Page 41: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 30 –

09 one preposition too many

Generalsekreterare för Amnesty International i London 1980-1986, chef för i Rädda barnen i Sverige 1986-92. / Generalsekreterare för Amnesty International i London 1980-1986, chef för Rädda barnen i Sverige 1986-92. (SvD Inrikes)

Preposition missing after a noun (MP) Another type of valency error occurs when there is no preposition after the noun but there should be one. Again, the error specification has been based on what kind of construction that follows the preposition. The difference between this subcategory and missing preposition in a prepositional phrase is that the choice of the preposition is governed by the preceeding noun even if the preposition is a part of a prepositional phrase.

02 noun + preposition

Jag har ett dubbelrum att boka i Rom, där ska jag stanna i en vecka och med en tår i ögonvrån hänga på restauranger, kaféer och barer dygnet och kedjeröka i kapp med stamgästerna. / Jag har ett dubbelrum att boka i Rom, där ska jag stanna i en vecka och med en tår i ögonvrån hänga på restauranger, kaféer och barer dygnet runt och kedjeröka i kapp med stamgästerna. (SvD Kultur)

03 noun + preposition + NP

... ordförande Gefleortens mejeriförening. /

... ordförande i Gefleortens mejeriförening. (UNT 970408 Ettan)

06 noun + preposition + infinitive phrase

... Sjöfartsverkets planer att lägga ner ... /

... Sjöfartsverkets planer på att lägga ner ... (UNT 970423 Ettan)

01 noun + preposition + att-clause

– Många av de medverkande i denna stora konsert har uttryckt önskemål att vi skall åstadkom-ma en gemensam manifestation, säger Konserthusets VD Sture Carlsson. / – Många av de medverkande i denna stora konsert har uttryckt önskemål om att vi skall åstad-komma en gemensam manifestation, säger Konserthusets VD Sture Carlsson. (GS7A)

05 noun + preposition + subordinate clause

Dessutom får politi kerna bättre insyn hur det står till ... / Dessutom får politi kerna bättre insyn i hur det står till ... (UNT 970422 Uppland)

04 other missing prepositions

... och var en de hetaste golfspelarna i USA. /

... och var en av de hetaste golfspelarna i USA. (UNT 970415 Sporten)

Other noun valency problems (NV) Noun valency is not only about choosing the proper preposition. It is also about constructing the following sentence in an appropriate way. The specifications cover different problems: missing subordinating att, wrong word category (the correct word should be a preposition), and the question whether to repete a preposition in coordination of complements.

Page 42: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 31 –

01 noun + preposition + att-clause – att missing

Kommunalmännens uppdrag som företrädare för de kommuner som är delägare i Sydkraft, skälet till de sitter i styrelsen, skulle alltså enligt SSU vara av mindre betydelse. / Kommunalmännens uppdrag som företrädare för de kommuner som är delägare i Sydkraft, skälet till att de sitter i styrelsen, skulle alltså enligt SSU vara av mindre betydelse. (SvD Ledare)

02 wrong word category

uppkomsten va vissa cancerformer / uppkomsten av vissa cancerformer (UNT 970303 Uppsala)

03 repetition or not of preposition

Det är inget tal om att arbetslöshetsförsäkringen är en socialförsäkring, ej heller om att den kan spela en roll i arbetsmarknadspoliti ken. / Det är inget tal om att arbetslöshetsförsäkringen är en socialförsäkring, ej heller att den kan spela en roll i arbetsmarknadspoliti ken. (SvD Ledare)

Coordination (CO) Problems with coordinations within the noun phrase are addressed here, except for a special kind of noun valence problem addressed above. Missing conjunction is one error type. No specification is based on what within the noun phrase are coordinated. Asymmetric coordination is also adressed in the coordination subcategory, even if the coordinated words should be adjectives constituting an adjective phrase.

01 conjunction missing

Manglad frigolit påstås slimma lår rumpa. / Manglad frigolit påstås slimma lår och rumpa. (UNT 970430 För Dagen)

02 asymmetric coordination

Den som tycker att skräddad kostym är för uppklätt kan välja den nya mjuka och kostymsilhuetten, en modell som ... / Den som tycker att skräddad kostym är för uppklätt kan välja den nya mjuka och lediga kostymsilhuetten, en modell som ... (UNT 970219 För Dagen)

03 comma replaced by coordinating conjunction

Jag och min familj , vänner, kamrater från arbetslivet, flygkamrater saknar Erik. / Jag och min familj , vänner, kamrater från arbetslivet och flygkamrater saknar Erik. (UNT 970412 Familj )

04 other coordination problem

... för sitt dagliga bröd och överlevnad. /

... för sitt dagliga bröd och sin överlevnad. (UNT 970503 Läsarnas Forum)

Word order (WO) Word order problems within the noun phrase are dealt with here. Other word order problems belong to the word order category. The specifications state what word categories are involved.

Page 43: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 32 –

01 noun & adjective

Det som framför allt ökar kostnaderna i glesbygd är inbördes avstånd och till stora central-orten. / Det som framför allt ökar kostnaderna i glesbygd är avstånd inbördes och till stora central-orten. (UNT 970421 Debatt)

02 noun & participle

... en köpare av stulna datorer från Märstagymnasiet. /

... en köpare av datorer stulna från Märstagymnasiet. (UNT 970417 Uppland)

Other problems (OP) Problems within the noun phrase that cannot be fit in any other subcategory are gathered here. No further specification of the problems is made.

4.2.2 Adjective Phrase (AP)

Adjective phrases considered in the adjective phrase category occur as predicatives. As attributes in noun phrases, problems in the adjective phrases are dealt with in the noun phrase category. Errors in agreement between clause constituents belong to the agreement category. Otherwise, it is the same kind of errors that are classified in this category as in the adjective phrase subcategory in the noun phrase category.

Wrong word category (WC) The only type of error that so far could be classified in the adjective phrase category is when the wrong word category has been used as a premodifier of the adjective head.

01 adjective => adverb

Han är oerhörd glad över bildandet av European Cities Against Drugs. / Han är oerhört glad över bildandet av European Cities Against Drugs. (GS5ABC)

Choice of preposition after an adjective (CP) Adjectives can govern the choice of a following preposition. These valency errors are specified in accordance with the type of the complement. Cases in which a preposition has been erroneously inserted fall within this subcategory as well .

02 adjective + preposition + att-clause

Gustav Lili enberg var lättad att han slapp stå på scen och provspela. / Gustav Lili enberg var lättad över att han slapp stå på scen och provspela. (UNT 970416 Uppsala)

03 adjective + infinitive phrase [no preposition]

... , en bild vi inte är vana vid att se. /

... , en bild vi inte är vana att se. (UNT 970409 För Dagen)

01 adjective + att-clause [no preposition]

Visst har jag förståelse för att det är viktigt med att kunskap och specialistvård centraliseras och att man ska få kontinuitet i behandlingen av barnhjärtan. / Visst har jag förståelse för att det är viktigt att kunskap och specialistvård centraliseras och att man ska få kontinuitet i behandlingen av barnhjärtan. (UNT 961022 Läsarnas Forum)

Page 44: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 33 –

Comparing ” än” (CM) After an adjective in the comparative the word än may follow when making a comparison. However, this word might be missing or replaced by another expression. No specification is made.

... hemma hos Mats Götbring - knappt längre ett trettiotal meter från ... /

... hemma hos Mats Götbring - knappt längre än ett trettiotal meter från ... (UNT 970416 Uppland)

Och minskningen är större när det gäller Gefleortens mejeriförening jämfört med i övriga landet. / Och minskningen är större när det gäller Gefleortens mejeriförening än i övriga landet. (UNT 970408 Ettan)

4.2.3 Adverb Phrase (AB)

An adverb phrase consists of one or more adverbs. Problems in such a phrase belong to the adverb phrase category with a few exceptions. Adverbs as premodifiers to adjectives are dealt with in the adjective phrase category or in the adjective phrase subcategory in the noun phrase category. Erroneous placements of adverbs within clauses fall i n the word order category. Wrong word category errors are addressed in a separate category. Erroneous constructions with conjunctional adverbs are dealt with in the conjunctions and conjunctive adverbs category. No differentiation has been made between different types of adverbs on the specification level.

Word missing (WM) No specification is made of the missing adverbs.

För att återgå till björnen så närmar vi oss mer och det rykte vårt land har ute i världen. / För att återgå till björnen så närmar vi oss mer och mer det rykte vårt land har ute i världen. (RS19)

Doubled word (DW) An adverb has been doubled, and one of the words should be removed. No specification is made.

Det kördes också också två treårslopp. / Det kördes också två treårslopp. (UNT 970502 Sport)

Word order (WO) Word order problems between adverbs are addressed here. No specification is made.

... kan givetvis dock på goda grunder ifrågasättas. /

... kan dock givetvis på goda grunder ifrågasättas. (UNT 970423 Ledare)

Other problems (OP) No specification is made.

Till sista låstes de in bakom gallergrindarna i Olaine. / Till sist låstes de in bakom gallergrindarna i Olaine. (SvD Inrikes)

4.2.4 Prepositional Phrase (PP)

Diff iculties in classifying erroneous prepositional expressions have already been discussed in the introduction to the grammar problems group. The errors within prepositional phrases concern either the preposition or its complement, which constitute the two subcategories. There are essentially three distinction problems concerning prepositional phrases. First, preposition problems have to be separated from valency errors. When the choice of preposition is governed by a

Page 45: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 34 –

verb, an adjective, or a noun, an erroneous choice is perceived as a valency error and classified in the proper phrase category. Second, prepositions may together with the subordinating att constitute complex subordinating conjunctions. A distinction has to be made between prepositions preceeding an att-clause and subordinating conjunctions initiating a clause. For simplicity, if a latter analyse may be done, the prepositions are seen as parts of complex subordinating conjunctions. Errors in such constructions belong thus to the category of conjunctions and conjunctional adverbs. Third, cases in which the preposition either is missing or is not a preposition are considered to be PP problems. These cases have the recognition problem in common, i.e. how should the PP be recognised when the best signal, the preposition, is not there. When the problem could be analysed as a verb valency error, that classification is preferred. All other instances fall i n the PP category.

Prepositions (PR) The word category preposition can be considered to contain two kinds of prepositions: simple prepositions and complex prepositions. Simple prepositions consist of one word while complex prepositions consist of at least two words which not necessarily are prepositions themselves, but together they make a lexicalised phrase functioning as a preposition. Not seldom the seperate words in a complex preposition may appear on their own. Errors in complex prepositions are therefore diff icult to categorise. Swedish grammars and dictionaries have been guidelines, together with the idea that if the expression may be replaced by a simple preposition without altering the meaning of the sentence more than slightly, the expression constitutes a complex preposition. Three specifications deal with problems which are solved by removing a preposition. If there should be no prepositional phrase, the error belongs to the first specification. If there are two different prepositions of which one should be removed, the error belongs to the second specification. If the same preposition appear twice, the error belongs to the specification 07.

01 preposition to be removed [should not be a prepositional phrase]

Hon gjorde totalt 27 mål i 1995, ... / Hon gjorde totalt 27 mål 1995, ... (UNT 970419 Sport)

02 one preposition too many

... om sin son Teds död i av narkotika. /

... om sin son Teds död av narkotika. (UNT 970416 Ettan)

07 doubled preposition

Frågorna är många: hur påverkas laxens och ålens vandring av av det elektromagnetiska fältet? / Frågorna är många: hur påverkas laxens och ålens vandring av det elektromagnetiska fältet? (SvD Inrikes)

Missing prepositions in what should be a prepositional phrase constitute the 03 specification. Specificaitons 08 and 09 deal with coordination of phrases where prepositions should be inserted. If the choice of preposition is governed by a noun, an adjective, or a verb, the error belongs to the appropriate phrase category. If what ought to be a preposition belongs to another word category, the error occurs on phrase level rather than on clause or sentence level, and thus falls within the 05 specification. Sometimes, a comma is replaced by a preposition; these errors belong to specification 10.

03 preposition missing

Men ännu är vi början, mönstret glänser, sommaren måste vara på väg. / Men ännu är vi i början, mönstret glänser, sommaren måste vara på väg. (RS25)

08 preposition missing in coordination of phrases – phrases of different types

Inte bara för vädrets skull utan att jag får ett så underbart leende från TV 4:s väderflicka Anki. /

Page 46: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 35 –

Inte bara för vädrets skull utan för att jag får ett så underbart leende från TV 4:s väderflicka Anki. (UNT 970221 För Dagen)

09 preposition missing in coordination of phrases – phrases of the same type

... för scenografin Tommy Glans, kostym och masker Lisbet Wahlström och för musiken Gunnar Edander. / ... för scenografin Tommy Glans, för kostym och masker Lisbet Wahlström och för musiken Gunnar Edander. (UNT 970217 Kultur)

05 wrong word category

Dess enda nedslag i denna volym – men vilket nedslag! – är Laurence Thomas holmgång med den sorts teori om moraliska utvecklingsstadier som har förfäktats av Kohlberg och fått en så framträdande plats hor Habermas. / Dess enda nedslag i denna volym – men vilket nedslag! – är Laurence Thomas holmgång med den sorts teori om moraliska utvecklingsstadier som har förfäktats av Kohlberg och fått en så framträdande plats hos Habermas. (CS4)

10 comma => preposition

... ett examensarbete vid Lantbruksuniversitets institution för ekonomi, Ultuna. /

... ett examensarbete vid Lantbruksuniversitets institution för ekonomi vid Ultuna. (UNT 970422 Uppsala)

Another error concerns choosing the proper preposition. To belong to this error type, the problem should not be a valency problem of any kind. The prepositions should not both be correct, since those problems belong to the style, meaning, and reference group.

04 wrong preposition; choice of preposition

– Det viktiga är att man kan koncentrationsläsa och studera efter sin egen takt. / – Det viktiga är att man kan koncentrationsläsa och studera i sin egen takt. (GS25ABC)

06 wrong preposition in coordinated PPs

... Kurt Forsberg, känd Tärnsjöprofil , lyssnar på ena örat på SM-finalen i ishockey och på det andra på bingoutroparen. / ... Kurt Forsberg, känd Tärnsjöprofil , lyssnar med ena örat på SM-finalen i ishockey och med det andra på bingoutroparen. (UNT 970412 Uppland)

Complements (CO) The complement in a prepositional phrase is normally a noun phrase, an infinitive phrase, or a subordinate clause. If the complement is of the wrong type, the problem could depend on how the clause ought to be constructed around the verb. In those cases, the errors belong to the verb valency category. Some prepositions call for a certain construction of the complement. A special case is the so called med phrase which can be analyzed as a rewritten or reformulated clause.

01 erronoeus construction after a certain preposition

Ordern är värd mellan 40-50 milj oner kronor. / Ordern är värd mellan 40 och 50 milj oner kronor. (SVD Näringsliv)

02 consistency in complements

Föräldrarollen måste ändras från åhörare till aktiv medverkan i skolan. / Föräldrarollen måste ändras från åhörare till aktiv medverkande i skolan. (UNT 970419 Uppsala)

Page 47: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 36 –

03 complement missing

... men i stället för har hon lagt in ljuständning. /

... men i stället för nattvarden har hon lagt in ljuständning. (UNT 970410 Uppland)

04 med phrase

... var det mörkt med svenska ögon. /

... var det mörkt med svenska ögon sett. (UNT 970502 Sport)

4.2.5 Conjunctions and Conjunctive Adverbs (CN)

The problems belonging to the conjunctions and conjunctive adverbs category are related to diff iculties in constructing clauses properly with conjunctions and conjunctive adverbs. Problems clearly referable to the construction of phrases belong to the proper phrase category. All doubled conjunctions, however, belong to the present category, along with problems with complex conjunctions. A complex conjunction consists of more than one word, and it may be discontinuous. Conjunctions may be divided into different types according to the relation between the phrases that the conjunction combines. No such distinction is made other than the distinction between coordinating and subordinating conjunctions. Problems with the word än are so far only dealt with in the adjective phrase category, since it often occurs after adjectives in comparisons. All word category problems in which conjunctions or conjunctive adverbs are the correct word categories are dealt with in this category except for choice of conjunction which is a problem belonging to the style, meaning, and reference group.

Conjunction or conjunctive adverb missing (CM) A conjunction may be missing. The problems are divided in groups according to the type of clause. When parts of phrases should be coordinated but the conjunction is missing, the error is addressed within the proper phrase category. A missing subordinating att may be a noun, adjective, or verb valency problem. Sometimes, a comma is replaced by a conjunction.

04 coordinating conjunction missing

Många tycker att det måste göras något därför satsar vi för första gången / Många tycker att det måste göras något och därför satsar vi för första gången (UNT 970417 Uppland)

01 subordinating conjunction or conjunctive adverb missing

Ingen har väl några större förväntningar på djupsinnigheter Jean-Claude Van Damme kommer loss med sina kampsportsövningar ... / Ingen har väl några större förväntningar på djupsinnigheter när Jean-Claude Van Damme kom-mer loss med sina kampsportsövningar ... (UNT 970419 Nöje)

02 comma => subordinating conjunction

Man kan t o m höra regeringsföreträdare säga, vi måste ställa hur stor den offentliga sektorn skall vara och sedan ordna resurser till den. / Man kan t o m höra regeringsföreträdare säga att vi måste ställa hur stor den offentliga sektorn skall vara och sedan ordna resurser till den. (UNT 970306 Debatt)

03 comma => coordinating conjunction

Läkemedelsverket stödde sitt beslut på läkemedelslagen, som säger att produkter som säljs för att förebygga, lindra eller bota sjukdomar är läkemedel, skall innan de får säljas vara godkända av läkemedelsverket. / Läkemedelsverket stödde sitt beslut på läkemedelslagen, som säger att produkter som säljs för att förebygga, lindra eller bota sjukdomar är läkemedel och skall innan de får säljas vara god-kända av läkemedelsverket. (UNT 970408 Sverige)

Page 48: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 37 –

Complex conjunction (CC) A complex conjunction is a conjunction consisting of more than one word. The term is also used for describing constructions with conjunctive adverbs and conjunctions. Complex conjunctions are continuous or discontinuous. When a part of the conjunction is missing or if the complex conjunction in other respects is improperly formed, the problem belongs to this subcategory. If the complex conjunction is missing altogether, the problem belongs to the conjunction missing subcategory above.

01 continuous

Du kan se det som en saga eller som en sann historia, med det gör du som du vill , ty även fast vi är reklammakare så är vi inte sådana till sättet att vi vill bestämma vad folk ska tycka och tänka. / Du kan se det som en saga eller som en sann historia, med det gör du som du vill , ty även om vi är reklammakare så är vi inte sådana till sättet att vi vill bestämma vad folk ska tycka och tänka. (SvD Kultur)

02 discontinuous

Om glädjebeskedet som omvandlades till en chock som vände upp och ned på hela deras till -varo och höll på att krossa såväl hälsa, äktenskap och ekonomi. / Om glädjebeskedet som omvandlades till en chock som vände upp och ned på hela deras till -varo och höll på att krossa såväl hälsa som äktenskap och ekonomi. (SvD Inrikes)

Doubled conjunctions (DW) A conjunction may appear twice, and the error belongs in the doubled conjunctions subcategory, no matter what the conjunction is coordinating or initiating. The two specifications state whether the conjunction or the conjunctice adverb is a coordinating or subordinating one.

01 coordinating conjunction

– Kan det här leda till färre och och aktuellare frågor, är det bra. / – Kan det här leda till färre och aktuellare frågor, är det bra. (SvD Stockholm)

02 subordinating conjunction

- Jag tror att att musik är ett bra sätt ... / - Jag tror att musik är ett bra sätt ... (UNT 970304 Ettan)

Erroneous conjunction (EC) A conjunction may have been erroneously inserted where there is no clause following it. There may also be two conjunctions of which one should be removed.

01 subordinating conjunction – no clause

Söndagens valresultat innebar att ett klart tummen ner till regeringen från de franska väljarna. / Söndagens valresultat innebar ett klart tummen ner till regeringen från de franska väljarna. (SvD Utrikes)

02 subordinating conjunction – two conjunctions

Det verkar inte heller som om att särskilt många av de medföljande kvinnor som ... / Det verkar inte heller som om särskilt många av de medföljande kvinnor som ... (UNT 970419 Utrikes)

Page 49: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 38 –

Wrong word category (WC) What ought to be a conjunction belongs to another word category. The erroneous word category is stated on the specification level. If the erroneous word can be analysed as belonging to several word categories, the error will be given the specification other.

01 pronoun

– Har vi bara lite bättre flyt än i fjol skall vi vara med oss slåss i toppen. / – Har vi bara lite bättre flyt än i fjol skall vi vara med och slåss i toppen. (UNT 970415 Sporten)

03 adverb

... fick vi njuta av hans sång och hans stora musikalitet där han mästerligt hanterade olika in-strument ... / ... fick vi njuta av hans sång och hans stora musikalitet då han mästerligt hanterade olika in-strument ... (UNT Familj enytt)

04 preposition

Därefter är de lediga till de kommer hem till Uppsala 10 maj. / Därefter är de lediga till s de kommer hem till Uppsala 10 maj. (UNT 970417 Sport)

05 verb

... och söka hjälp är någon gör dem ill a. /

... och söka hjälp när någon gör dem ill a. (UNT 970429 Debatt)

06 adjective

Vad såg du för film senaste du var på bio? / Vad såg du för film senast du var på bio? (UNT 970416 Sporten)

02 other

Uppsatserna är alltså god folkbildning med lägger enligt min mening allt för stor vikt vid de s k omdömena och omdömesfällandet och allt för liten vikt vid omgivande praxis. / Uppsatserna är alltså god folkbildning men lägger enligt min mening allt för stor vikt vid de s k omdömena och omdömesfällandet och allt för liten vikt vid omgivande praxis. (CS4)

4.2.6 Verb Phrase in the L imited Sense (VF)

In phrase grammars, the verb phrase is one of the most important constituents. Taking into consideration how the grammar checker will function, due to discontinuous properties of Swedish syntax, the VP is a less appropriate category. Instead, the verb phrase is used in a much more limited sense as a sequence of verbs. This limited verb phrase has been given the abbreviation VF to avoid confusion with the traditio-nal notion of verb phrase abbreviated VP. Verb valency problems are also dealt with, but in a separate ca-tegory. A verb phrase in the limited sense thus consists of a sequence of verbs (one or more). It could be the perfect formed by the present form of ha followed by a verb in the supine. Problems with auxili ary verbs are dealt with in this category, mainly because auxil iary verbs are followed by infinitives without the infinitive mark together forming a verb phrase in the limited sense. Erroneous constructions with auxili ary verbs and the infinitive mark belong to the verb phrase category. Infinitive phrases, on the other hand, consisting of the infinitive mark att and an infinitive plus potential complements are seen as a verb complement (normally functioning as an object). However, when the intended infinitive is not an infinitive, the error is perceived to be a verb phrase error.

Page 50: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 39 –

When a main or a subordinate clause lacks a verb phrase, the problem is classified as a missing constituent problem and not as a VF problem. To chose the correct tense is a problem that is not dealt with here but in the category of referential problems. The subcategorisation is based on sequences of different types of finite and infinite verbs occurring in the material. To base the subcategorisation on grammatical features such as tense, mood, and aspect is diff icult since the manifestations of these features overlap, and the classification would be influenced by interpretations of the sentences. An erroneous sequence of verbs may be corrected in different ways. The main principle is that the subcategories state what the correct verb phrase should be, and further information of the erroneously formed verb phrase is given on the specification level. The verb forms in the specifications are stated mainly in Swedish and not in English, since the verb systems of the two languages do not fully correspond with each other.

Main verb in the finite form (MF) If the clause is to contain a main verb in the finite form but there are, for instance, two finite verbs, the error belongs to this subcategory. The imperative together with the present tense and the past tense are considered to be finite verb forms. To be a clause, the clause ought to contain a finite verb. If the finite verb is missing, the error belongs to the missing constituent category. There is however an exception; if the clause has an infinite verb, the proper error type code is found in this subcategory of the verb phrase in the limited sense. Specificaitons dealing with two verbs of which one should be removed:

01 presens + presens => presens

Det har renderar honom åtta års fängelse. / Det renderar honom åtta års fängelse. (GS23A)

02 presens + preteritum => preteritum

Polisen har hörde flera vittnen under kvällen och utredningen kommer att fortsätta under tis-dagen. / Polisen hörde flera vittnen under kvällen och utredningen kommer att fortsätta under tisdagen. (SvD Inrikes)

03 preteritum + preteritum => preteritum

Just vid den tiden var stod dock kronan som svagast. / Just vid den tiden var dock kronan som svagast. (RSN1)

Specifications dealing with one verb which should be changed:

04 infinitiv => presens

Han bli den mittfältsstrateg som Gimo saknat .../ Han bli r den mittfältsstrateg som Gimo saknat ... (UNT 970415 Sporten)

08 infinitiv => preteritum

… kontaktat Grasshoppers inför Champions League-matchen mot Auxerre och sagt att han kunna "fixa" matchen ... / … kontaktat Grasshoppers inför Champions League-matchen mot Auxerre och sagt att han kunde "fixa" matchen ... (UNT 970419 Sport)

05 supinum => imperativ

Betänkt också de anläggningskostnader .../ Betänk också de anläggningskostnader ... (UNT 970430 Debatt)

Page 51: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 40 –

07 supinum => preteritum

Ernst Melin rest mycket med dotter och måg. / Ernst Melin reste mycket med dotter och måg. (UNT 970416 Uppland)

10 perfektparticip => presens

En sådan är när sådan kombinerad med traditionell cirkel- och styrketräning. / En sådan är när sådan kombineras med traditionell cirkel- och styrketräning. (UNT 970412 Ettan)

06 perfektparticip => preteritum

Den vänskap som uppstådd dem emellan ... / Den vänskap som uppstod dem emellan ... (UNT 970430 Kultur)

09 presensparticip => preteritum

Fimpande efter 50 års rökande / Fimpade efter 50 års rökande (UNT 970429 Ettan)

12 preteritum => imperativ

Röt inte före frukost. / Rök inte före frukost. (UNT 970218 Debatt)

Specification addressing erroneous infinitive mark:

11 att + preteritum => preteritum

En avgörande punkt var att företaget hade givit flera av de äldre kommentatorerna dåliga betyg och att bett dem välja mellan enklare jobb ... / En avgörande punkt var att företaget hade givit flera av de äldre kommentatorerna dåliga betyg och bett dem välja mellan enklare jobb ... (UNT 970415 Ledare)

Temporal auxili ary verb in the finite form + Main verb in the supine (TS) This subcategory contains errors in forming the perfect (har + the supine) and the past perfect (hade + the supine) tenses. All questions about choosing the proper tense belong, as already mentioned, to the referential problems category. The temporal auxili ary verb may be omitted in subordinate clauses; if the auxili ary verb ought to be inserted in cases where it is possible to leave it out, the problem falls in the style, meaning, and reference group. Erroneous omission, however, falls in the present subcategory, as does incorrect choice of infinitive verb form when the correct one is the supine even though the auxili ary verb is omitted. Specifications dealing with erroneous infinite verb forms:

01 har/hade + presens => har/hade + supinum

– Användningen har ökar enormt i länder som har prövat att legalisera olika droger. / – Användningen har ökat enormt i länder som har prövat att legalisera olika droger. (GS5ABC)

02 har/hade + infinitiv => har/hade + supinum

– Vi har inte kvantifiera det, men det är klart att det får ekonomiska konsekvenser. / – Vi har inte kvantifierat det, men det är klart att det får ekonomiska konsekvenser. (SvD Näringsliv)

Page 52: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 41 –

08 har/hade + perfektparticip => har/hade + supinum

... har skrivet brev till ... /

... har skrivit brev till ... (UNT 970412 Ledare)

07 auxili ary verb omitted + perfect participle

Att kostnaderna ökad med 324 milj oner förklaras av organisatoriska förändringar, lönerevision och höjda hyreskostnader till följd av ombyggnationen av KS. / Att kostnaderna ökat med 324 milj oner förklaras av organisatoriska förändringar, lönerevision och höjda hyreskostnader till följd av ombyggnationen av KS. (SvD Stockholm)

Specifications dealing with erroneous auxili ary verbs:

09 ha + supinum => har/hade + supinum

Tio företag inom läkemedels- och naturläkemedelsbranschen ha lagt ... / Tio företag inom läkemedels- och naturläkemedelsbranschen har lagt ... (UNT 970429 Ettan)

03 wrong auxili ary verb

Dess enda nedslag i denna volym – men vilket nedslag! – är Laurence Thomas holmgång med den sorts teori om moraliska utvecklingsstadier som är förfäktats av Kohlberg och fått en så framträdande plats hos Habermas. / Dess enda nedslag i denna volym – men vilket nedslag! – är Laurence Thomas holmgång med den sorts teori om moraliska utvecklingsstadier som har förfäktats av Kohlberg och fått en så framträdande plats hos Habermas. (CS4)

04 doubled auxili ary verb

Sedan har medierna har lyft fram den förhållandevis lugna stämningen och – enligt uppgift – ”puffat på” försoningen. / Sedan har medierna lyft fram den förhållandevis lugna stämningen och – enligt uppgift – ”puffat på” försoningen. (GS6A)

05 missing auxili ary verb

Men kvinnan från Älvsjö inte betalt sin andel av insatsen. / Men kvinnan från Älvsjö hade inte betalt sin andel av insatsen. (RS18)

06 wrong word category of the auxili ary verb

Jag hart hört om en stad ovan molnen. / Jag har hört om en stad oven molnen. (UNT 970415 Familj )

Existential auxili ary verb in the finite form + Main verb in the perfect participle (EP) The auxili ary verb vara may be followed by the perfect partiple. Errors in such a verb phrase are dealt with in this subcategory. As in the previous subcategory, the problem may be an erroneous infinite verb form or an erroneous auxili ary verb.

01 är/var + presens => är/var + perfektparticip

UNT:s ledare var inför 11/4. UNT:s ledare var införd 11/4. (UNT 970421 Debatt)

Page 53: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 42 –

02 auxili ary verb missing

Väl uppe på hotell rummet uppmanade flickorna sedan turisterna att suga på deras bröstvårtor, som insmorda med starka sömnmedel. / Väl uppe på hotell rummet uppmanade flickorna sedan turisterna att suga på deras bröstvårtor, som var insmorda med starka sömnmedel. (SvD Inrikes)

Auxili ary verb in the finite form + Main verb in the infinitive (AI) The group of auxili ary verbs is, however, not clearly-defined. The definition of auxil iary verbs is, for the purpose of the error typology, purely operational: If a verb is followed by a verb in the infinitive without the infinitive mark (att), then it is referred to as an auxili ary verb. By this definition, a verb such as låta may be perceived to be an auxili ary verb depending on the context along with the traditional modal auxili ary verbs such as bör and måste. The subcategorisation is based on the incorrect sequence of verb forms. The correct form of the auxili ary verb (whether it should be in the present or in the past tense) is not stated. Missing infinitives could be seen as a verb valency problem of the auxili ary verb; an auxili ary verb is constructed with an infinitive as a complement. This view is though a bit awkward, since verb valency normally is perceived to deal with the complements as clause constituents; i.e. the verb valency of the main verb. Therefore, incorrectly formed verb phrases with auxili ary verbs are dealt with in the present subcategory. When the problems concern the auxili ary verb, if it is not in a finite form, one of the following specifications may be appropriate:

01 infinitiv + infinitiv => presens/preteritum + infinitiv

– Om människor börja tro på en förändring ... / – Om människor börjar tro på en förändring ... (UNT 970414 Uppsala)

05 supinum + infinitiv => presens/preteritum + infinitiv

Här tyckts antas att tanken är steget före varje rimlig handling. / Här tycks antas att tanken är steget före varje rimlig handling. (CS4)

10 wrong word category of the auxili ary verb

Tucker är fortfarande med men Morrison han dö under mellantiden. / Tucker är fortfarande med men Morrison hann dö under mellantiden. (SvD Kultur)

13 missing auxili ary verb

... för dom som lägga upp hemsidor ... /

... för dom som vill l ägga upp hemsidor ... (UNT 970424)

14 doubled auxili ary verb

Jättestaten Kongo kan med sina väldiga rikedomar kan bli en motor för hela regionens renässans, som Sydafrika blivit för södra Afrika. / Jättestaten Kongo kan med sina väldiga rikedomar bli en motor för hela regionens renässans, som Sydafrika blivit för södra Afrika. (SvD Utrikes)

Another type of error occurs when the verb that should be in the infinitive is not. It might also be the case that it is missing.

02 presens + preteritum => presens + infinitiv

Hur trygghet inte längre kan var statisk utan ligga i förnyelsen, utvecklingen och föränd-ringen. / Hur trygghet inte längre kan vara statisk utan ligga i förnyelsen, utvecklingen och föränd-ringen. (CS1)

Page 54: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 43 –

03 presens + presens => presens + infinitiv

… det får man har förståelse för … / … det får man ha förståelse för … (UNT 970415 Uppland)

04 preteritum + preteritum => preteritum + infinitiv

Domstolen fann det bevisat att Markus Wolf 1962 lät kidnappade den avhoppade östtyske Stasiagenten Walter Thräne, som hade gömt sig i Österrike men som av ett Stasikommando fördes till baka till DDR där han till bringade tio år i fängelse. / Domstolen fann det bevisat att Markus Wolf 1962 lät kidnappa den avhoppade östtyske Stasiagenten Walter Thräne, som hade gömt sig i Österrike men som av ett Stasikommando fördes till baka till DDR där han till bringade tio år i fängelse. (SvD Utrikes)

08 preteritum + supinum => preteritum + infinitiv

Redan för några år sedan fick de varit så försiktiga vid renoveringen att ... / Redan för några år sedan fick de vara så försiktiga vid renoveringen att ... (UNT 970408 Ettan)

11 preteritum + imperativ => preteritum + infinitiv

Och hur skulle man ställ sig till det svenska förflutna? / Och hur skulle man ställa sig till det svenska förflutna? (UNT 970219 Kultur)

06 missing infinitive

Vi är 16 organisationer som vill EU-mopeden som ett femtonårsfordon utan körkort, säger Jan Ribnert. / Vi är 16 organisationer som vill ha EU-mopeden som ett femtonårsfordon utan körkort, säger Jan Ribnert. (RSM3)

15 doubled infinitive or two infinitives

... ska Frälsningsarmén sälja sälja kårfastigheten ... /

... ska Frälsningsarmén sälja kårfastigheten ... (UNT 970424 Uppland)

09 wrong word category of the infinitive

… ingen vill bi av med sitt jobb … / … ingen vill bli av med sitt jobb … (UNT 970306 Ledare)

A third kind of problems concerns incorrect infinitive marks. Auxili ary verbs should be followed by the verb in the infinitive without the infinitive mark. In the following specifications, att should be removed.

07 presens/preteritum + att + infinitiv [att should be removed]

Jag kan förstå att Jan Björklund och Carl Cederschiöld är lite uppröda, men vi skall nog att lösa det här problemet också. / Jag kan förstå att Jan Björklund och Carl Cederschiöld är lite upprörda, men vi skall nog lösa det här problemet också. (SvD Stockholm)

12 att + presens + infinitiv [att should be removed]

... det är vård, omsorg och skola som vi anser att skall prioriteras ... /

... det är vård, omsorg och skola som vi anser skall prioriteras ... (UNT 970416 Uppland)

Page 55: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 44 –

Combination of auxili ary verbs + Main verb (AM) The first verb has to be in the finite form, the following auxili ary verbs have to be either in the infinitive or in the perfect infinitive (i.e. ha + the supine). However, the temporal auxili ary verb in the perfect and the past perfect tenses may be omitted in subordinate clauses, which leaves the verb phrase without an initial finite verb. The first verb form in such a sequence should thus be the supine. (For detection of errors in such phrases, it could be necessary to take the context outside the verb phrase in the limited sense into consideration. Despite this, the problems belong to the VF category, mainly because the error is within the limited verb phrase.) The auxil iary ha in the perfect infinitive may be omitted and the clause would still be correct. The omission of ha could therefore be seen as a stylistic problem, but this view is not taken. For simplicity, all instances of omitted ha are perceived as grammar problems and gathered in a separate subcategory.

01 two finite auxili ary verbs

Något borde man ju har lärt sig. / Något borde man ju ha lärt sig. (UNT 961022 Debatt)

02 infinitive + infinitive

Prestige och överdrivna förhoppningar om en vändning har gjort att de misslyckade affärerna kunna rulla vidare. / Prestige och överdrivna förhoppningar om en vändning har gjort att de misslyckade affärerna kunnat rulla vidare. (UNT 961022 Debatt)

03 supine + imperative / perfect participle

I takt med att allt fler börjat använd hjälm har även jag börjat närma mig en punkt där jag skulle kunna börja använda den förhatliga huvudbonaden även på min egen skalle. / I takt med att allt fler börjat använda hjälm har även jag börjat närma mig en punkt där jag skulle kunna börja använda den förhatliga huvudbonaden även på min egen skalle. (SvD Kultur)

04 ha + perfect participle

Även här verkar Jenssen ha använd en hel del bearbetade milj öljud; hotfulla skrapanden, rasslanden och klinganden vecklar i slow motion ut sig över ljudbilden. / Även här verkar Jenssen ha använt en hel del bearbetade milj öljud; hotfulla skrapanden, rasslanden och klinganden vecklar i slow motion ut sig över ljudbilden. (SvD Kultur)

05 ha doubled

Det videoproduktionsbolag som Boesak och hans hustru Elna drev skall ha enligt åklagaren ha bedragit svenska Sida på 1,1 milj oner kronor. / Det videoproduktionsbolag som Boesak och hans hustru Elna drev skall enligt åklagaren ha bedragit svenska Sida på 1,1 milj oner kronor. (SvD Utrikes)

06 modal auxili ary + supine

Och i och med att Lars Tobiasson själv havererade finansieringen med vägtullar får vi fått hitta en annan finansiering. / Och i och med att Lars Tobiasson själv havererade finansieringen med vägtullar har vi fått hitta en annan finansiering. (SvD Stockholm)

Coordination of verbs (CO) In coordinations, the second coordinated verb form should be in the same form as the first one. The conjunction may also be missing.

Page 56: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 45 –

01 auxili ary verb + coordinated infinitives

Vem litar på en samarbetspartner som bjuder in till ett samarbete som han själv är motståndare till eller inte vill vara med och utformat. / Vem litar på en samarbetspartner som bjuder in till ett samarbete som han själv är motståndare till eller inte vill vara med och utforma. (CS1)

02 bliva + coordinated perfect participles

Innan hon föll i hop medvetslös blev hon slagen och sparkade ytterligare. / Innan hon föll i hop medvetslös blev hon slagen och sparkad ytterligare. (GS19A)

03 coordinating conjunction missing

- Söderfors sång- och musikgrupp brukar åka runt framträda på olika ... / - Söderfors sång- och musikgrupp brukar åka runt och framträda på olika ... (UNT 19970424 Familj enytt)

Infinitive in infinitive phrase (IP) In infinitive phrases, there must be an infinitive after the mark att. If the verb is not an infinitive, the error belongs to this subcategory in the VF category. All types of verb valency problems are dealt with in the verb valency category. The specifications state the erroneous verb form that should be changed into the infinitive.

01 presens => infinitiv

Från början hade P.A. inte en tanke på att bli r professor. / Från början hade P.A. inte en tanke på att bli professor. (UNT 970426 Ettan)

02 supinum => infinitiv

Som framgick på nyhetsplats i SvD i går kommer storstadskommittén att i vår presenterat ett dokument som visar att det finns bostadsområden med hög andel låginkomsttagare. / Som framgick på nyhetsplats i SvD i går kommer storstadskommittén att i vår presentera ett dokument som visar att det finns bostadsområden med hög andel låginkomsttagare. (SvD Ledare)

05 perfektparticip => infinitiv

Om syftet enbart är att öka sysselsättningen är den effektivaste metoden att sänkta arbets-givaravgiften för de grupper som har svårast att finna jobb. / Om syftet enbart är att öka sysselsättningen är den effektivaste metoden att sänka arbets-givaravgiften för de grupper som har svårast att finna jobb. (SvD Ledare)

06 presens + infinitiv => infinitiv

... har lovat sig själv att i alla fall skall slå Turkiet. /

... har lovat sig själv att i alla fall slå Turkiet. (UNT 970502 Sport)

03 missing infinitive

Efter att plöjt nästan trettio år amerikansk västkustkonst är man mör i skallen, samtidigt börjar det snurra lite extra i däruppe. / Efter att ha plöjt nästan trettio års amerikansk västkustkonst är man mör i skallen, samtidigt börjar det snurra lite extra i däruppe. (SvD Kultur)

Page 57: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 46 –

04 wrong word category

Sydafrika var snabbt ute med att erkännande Laurent Kabila som president med motiveringen att man vill undvika ett maktvakuum. / Sydafrika var snabbt ute med att erkänna Laurent Kabila som president med motiveringen att man vill undvika ett maktvakuum. (SvD Utrikes)

Other problems (OP) There are erroneous sequences of verbs that do not easily fit into any of the other subcategories. These problematic cases are gathered in this subcategory. If this category is to contain many instances, patterns may be sought and the classification revised to fit the problem types found.

De samlar in sina "gill es", de män som har ensamrätt på att uppträda i karnevalskostym, inval-da i herrklubbar, där nya medlemmar måste vara rekommenderas av grannar eller vänner av långt datum. / De samlar in sina "gill es", de män som har ensamrätt på att uppträda i karnevalskostym, inval-da i herrklubbar, där nya medlemmar måste rekommenderas av grannar eller vänner av långt datum. (MS11)

4.2.7 Verb Valency (VV)

Verbs can be divided into different classes depending on how clauses should be constructed around them. The main classes consist of intransitive, transitive and reflexive verbs. One might also divide between transitive verbs that require one or two objects. The verb complements may also be obligatory or optional. In addition, a verb may be a member of more than one verb class. Other verbs may take prepositional objects, adverbials or objects with infinitive as complements. The subcategories state verb classes to which verbs may belong, and types of verb complements that are problematic. More precise information is given by the specifications. The subject of the clause is also perceived as a verb complement. Missing subjects is thus a subcategory, as is missing verb phrases in the limited sense. Erroneous choice of prepositions and adverbs governed by the verb is also a verb valency error. The complements may be of different types. Using the same guidelines as above, the subcategorisation is based on the correct complement type, and the specification level gives information of the error. Verbal expressions are also regarded as verbs, such as ta plats and ha rätt. A verbal expression consists of, for instance, a verb and a noun that are closely related with the stress on the noun which also carries the meaning of the expression.

Intransitivity (IN) An intransitive context requires an intransitive verb. A transitive verb erroneously constructed as if it were intransitive may be replaced by its intransitive equivalent if such a verb exists. Another way to solve the problem is to change the context, for instance transforming a noun phrase into a prepositional phrase. Note that phrasal verbs are seen as one unit.

01 transitive verb => intransitive verb

När visiret lossade rörde det sig kraftigt, och drog därmed ut rampen. / När visiret lossnade rörde det sig kraftigt, och drog därmed ut rampen. (GS15AC)

– Jag känner till att en av pojkarna kan vara drabbad av MBD, säger chefspsykolog Jon Aarseth, som leder det hjälpteam som ska överta när polisen är färdig med sina förhör. / – Jag känner till att en av pojkarna kan vara drabbad av MBD, säger chefspsykolog Jon Aarseth, som leder det hjälpteam som ska ta över när polisen är färdig med sina förhör. (GS20AB)

02 transitive context => intransitive context

... lämna ifrån sig makten och gå exil . /

... lämna ifrån sig makten och gå i exil . (UNT 970410 Ettan)

Page 58: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 47 –

Transitivity (TR) A transitive verb requires a transitive context. This subcategory is closely related to the previous subcategory. It could also be the case that the context is transitive but the verb is intransitive. If the verb is changed, the error belongs to this subcategory. On the other hand, if the context is changed, the error belongs to the intransitivity subcategory.

01 transitive verb => transitive context

Oppositionsborgarrådet Jan Björklund skall skriva brev till samtliga partier för att få med på en uppvaktning av regeringen, även socialdemokraterna och centerpartiet som på riksplanet står bakom förslaget. / Oppositionsborgarrådet Jan Björklund skall skriva brev till samtliga partier för att få med dem på en uppvaktning av regeringen, även socialdemokraterna och centerpartiet som på riksplanet står bakom förslaget. (SvD Stockholm)

02 intransitive verb => transitive verb

Hela den "försöksverksamhet" som förgick införandet av ... / Hela den "försöksverksamhet" som föregick införandet av ... (UNT 970424 Debatt)

Copula (CO) Some verbs connect the subject with a complement usually consisting of an adjective phrase. Problems in verb usage in such constructions belong in the verb valency category, while agreement problems are dealt with in the agreement category.

01 transitive verb => copula

Hon har väldigt snabb och har dessutom ... / Hon är väldigt snabb och har dessutom ... (UNT 970416 Sporten)

Reflexivity (RE) Errors concerning verbs that are non-reflexive but have been constructed with reflexive pronouns receive the specification 01. Verbs that ought to have a reflexive construction but have not (i.e. the reflexive pronoun is missing) get the specification 02. Specification 03 deals with erroneous reflexive constructions with more than one reflexive pronoun. Specification 04 addresses problems with erroneous words, words that should be a reflexive pronoun. Other problems with reflexivity belong to the last specification.

01 reflexive => non-reflexive

Det intressanta med skyddsämnet är att det liknar en del av naturligt förekommande plas-minogen, ett ämne som cirkulerar i blodet och som medverkar till blodets förmåga att koagulera sig. / Det intressanta med skyddsämnet är att det liknar en del av naturligt förekommande plas-minogen, ett ämne som cirkulerar i blodet och som medverkar till blodets förmåga att koagulera. (GS16ABC)

... bör skräpa sig ytterligare ... /

... bör skärpa sig ytterligare ... (UNT 970429 Uppsala)

02 non-reflexive => reflexive

På lördag ansluter bl a Japans och Kinas utrikesministrar inom ramen för det nystartade asia-tisk-europeiska mötet, ASEM. / På lördag ansluter sig bl a Japans och Kinas utrikesministrar inom ramen för det nystartade asiatisk-europeiska mötet, ASEM. (SvD Ledare)

Page 59: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 48 –

03 one reflexive pronoun too many

Han har bestämt sig för sig att sluta. / Han har bestämt sig för att sluta. (UNT 970408 Ettan)

04 wrong word – should be a reflexive pronoun

Man kan t o m fråga som om skönhet ens var relevant ... / Man kan t o m fråga sig om skönhet ens var relevant ... (UNT 970505 Kultur)

05 other problems with reflexivity

... för att man ska förstå sig själ ... /

... för att man själv ska förstå sig själv ... (UNT 970429 Debatt)

Passive constructions (PC) There are several ways of expressing the passive voice; it does not necessarily involve the so called s-form of the verb, nor a construction with the verb bliva. Errors in passive contructions are dealt with in this subcategory. The specification level is based on how the problems are dealt with: if the verb is changed or if the context is altered.

01 s-form: active voice => passive voice

Några löften gav inte vid tisdagens möte ... / Några löften gavs inte vid tisdagens möte ... (UNT 970416 Uppland)

02 s-form: passive voice => active voice

Jag arbetar bara för att svenska myndigheter ska följa de konventioner och avtal som man förbundits sig att följa, säger Christa Nyblom. / Jag arbetar bara för att svenska myndigheter ska följa de konventioner och avtal som man förbundit sig att följa, säger Christa Nyblom. (SvD Inrikes)

03 construction with få

– Jag får tas på mig min bit, men alla är delaktiga, jag, spelarna och styrelsen. / – Jag får ta på mig min bit, men alla är delaktiga, jag, spelarna och styrelsen. (UNT 961023 Sport)

04 active context => passive context

... men berörs inte direkt schismen eftersom ... /

... men berörs inte direkt av schismen eftersom ... (UNT 970416 Ledare)

05 passive context => active context

Som stora och kraftfulla är de lite långsammare, men de kompenseras genom att läsa spelet. / Som stora och kraftfulla är de lite långsammare, men de kompenserar de genom att läsa spelet. (UNT 970416 Sporten)

Object with infinitive (OI) Certain verbs take objects with infinitive as complements. The infinitive should not be preceeded by the infinitive mark att.

Page 60: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 49 –

01 preteritum + NP + att + infinitiv [att to be removed]

Han lovade repatriering av hutuflyktingar, men lät sina soldater att massakrera dem. / Han lovade repatriering av hutuflyktingar, men lät sina soldater massakrera dem. (SvD Utrikes)

02 other erroneous construction

- De stora belysta aff ischtavlorna som vildvuxet spritt sig över staden ser vi helst att försvinner ur innerstadsmilj ön, säger Göran Söderström, sekreterare i Skönhetsrådet. / - De stora belysta aff ischtavlorna som vildvuxet spritt sig över staden ser vi helst försvinna ur innerstadsmilj ön, säger Göran Söderström, sekreterare i Skönhetsrådet. (SvD Stockholm)

Prepositional phrase (PP) Certain verbs and verbal expressions take a prepositional phrase as a complement. The phrase may function as an adverbial. The problem in this subcategory consists of erroneous constructions with prepositional phrases as complements. If the prepositional phrase is missing, the problem might belong to the missing constituents category, but since the PP is so closely related to the verb or the verbal expres-sion, it is addressed within the verb valency category.

01 PP missing

Tror inte att jag haft någon mer nytta. / Tror inte att jag haft någon mer nytta av honom. (UNT 970415 Sporten)

Infinitive phrase (IP) An infintive phrase consists of the infinitive mark att and an infinitive (plus potential complements). The infinitive phrase may function as an object to many transitive verbs. If the infinitive is not an infinitive, the error is considered to be a verb phrase error belonging to the VF category. Erroneously constructed objects with infinitives are dealt with in a separate subcategory in the VV category. Missing infinitive mark is one of the error types addressed in this verb valency subcategory. The verb komma constitutes a certain case of missing infinitive mark, since this verb functions as an auxili ary verb but is constructed with an infinitive phrase and not only the infinitive. It also happens that the infinitive mark incorrectly has been doubled. The fourth specification addresses erroneously inserted infinitive marks. The last specification deals with cases where the infinitive mark has been replaved by another word.

01 the infinitive mark att missing after the verb komma

– Det kommer rensa ut de värsta filmerna, säger expeditionschef Helge Sönderland. / – Det kommer att rensa ut de värsta filmerna, säger expeditionschef Helge Sönderland. (GS19ABC)

02 the infinitive mark att missing – other cases

Som den dagen när Eva-Lena Uddenbäck från Stockholm bestämde sig för undersöka om det möjli gen kan gå att starta biograf i Uganda. / Som den dagen när Eva-Lena Uddenbäck från Stockholm bestämde sig för att undersöka om det möjli gen kan gå att starta biograf i Uganda. (RSN10)

03 the infinitive mark att doubled

Det är dock inte bara ungdomar och andra entusiaster med direkt eller indirekt intresse att att köra fartbåtar som insett fördelarna med att lära sig mer om att hantera motorbåtar. / Det är dock inte bara ungdomar och andra entusiaster med direkt eller indirekt intresse att köra fartbåtar som insett fördelarna med att lära sig mer om att hantera motorbåtar. (RSM6)

Page 61: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 50 –

04 the infinitive mark att to be removed

D v s att se till att varje ... / D v s se till att varje ... (UNT 970505 Läsarnas Forum)

05 wrong word

Vad gäller de länder som lämnar mycket i övrigt i önska vad gäller demokrati / Vad gäller de länder som lämnar mycket i övrigt att önska vad gäller demokrati (SvD Ledare)

Clause (CL) Clauses may also function as verb complements. A missing subordinating att is adressed here when the verb is constructed with an att-clause as complement.

01 att missing in att-clause

Jag tror inte det finns någon risk att vi bli r utan förslag. / Jag tror inte att det finns någon risk att vi bli r utan förslag. (GS9ABC)

02 erroneous PP – preposition to be removed

Position holding ” det” (ID) Swedish is a positional language. There are certain constructions in which det has no meaning or function other than filli ng an obligatory position in the clause. One type is the cleft sentence which emphasizes a particular constituent. Another type is the existential det which has to take the place of the subject (or object) to make the clause syntactically complete. The existential det might be analysed in functional terms as the formal subject (object). The errors that have occurred concerning det as a position holding constituent involve problems in using the proper pronoun.

01 existential det

I I talien är de annars jättesvårt att få jobb. / I I talien är det annars jättesvårt att få jobb. (UNT 970220 Uppsala)

02 det in emphatic constructions

De var i december 1995 som bröderna Leto slog upp portarna ... / Det var i december 1995 som bröderna Leto slog upp portarna ... (UNT 970418 Uppsala)

VF missing (VM) Missing auxili ary verbs is a type of problem dealt with in the category of verb phrase in the limited sense, since a verb phrase exists although it is not correct. If the verb phrase is missing, however, the problem belongs here. No distinction is made between main clauses and subordinate clauses. The two specifications state how the errors have been corrected: a verb is inserted, or a verb is replacing another word (belonging to another word category).

01 verb inserted

I ett land där man inte drar sig för att utmäta hårda straff har detta lett till ett ifrågasättande av hela rättsväsendet för ungdomsbrottslingar – drastiska metoder som milit ärliknande tränings-läger och utegångsförbud efter klockan 23.00 prövas, och alla inblandade från sociologer och psykologer till polis och domare vad man skall göra med barn som begår samma slags brott som vuxna. / I ett land där man inte drar sig för att utmäta hårda straff har detta lett till ett ifrågasättande av hela rättsväsendet för ungdomsbrottslingar – drastiska metoder som milit ärliknande tränings-

Page 62: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 51 –

läger och utegångsförbud efter klockan 23.00 prövas, och alla inblandade från sociologer och psykologer till polis och domare diskuterar vad man skall göra med barn som begår samma slags brott som vuxna. (GS26AB)

02 wrong word category

Den här hemma på den politi ska dagordningen. / Den hör hemma på den politi ska dagordningen. (UNT 970417 Ledare)

NP missing (NM) This subcategory deals with missing noun phrases as subjects in main clauses and in subordinate clauses. The specifications are based on the types of clauses involved. Inversion is also taken into account on the specification level.

01 subject in clause with inversion

Förmodligen kan också likna honom vid en kanadensisk ... / Förmodligen kan man också likna honom vid en kanadensisk ... (UNT 970219 Nöje)

02 subject in clause without inversion

Har alldeles för många skador och ids inte koncentrera mig på femsetsmatcher. / Jag har alldeles för många skador och ids inte koncentrera mig på femsetsmatcher. (SvD Sport)

03 subject in att-clause

Han räknar med att skall prövas i en rättegång. / Han räknar med att saken skall prövas i en rättegång. (RS13)

04 subject in relative clause

Dessutom finns huvudrätter som varierar med uppskrivna på en svart ... / Dessutom finns huvudrätter som man varierar med uppskrivna på en svart ... (UNT 970418 Uppsala)

Choice of preposition/adverb after verbs (CP) The specification of erroneous particles in phrasal verbs has been made according to both preposition or adverb and type of complement. This subcategory does also contain cases where no preposition is the correct choice, and cases of doubled preposition of which one should be removed. If stylistic and semantic issues are the main basis for the change of preposition or adverb, the problem belong to the style, meaning, and reference group. Specifications dealing with replacing one word with another:

01 verb + preposition + NP

När myndigheten delades till vägverket och naturvårdsverket ... / När myndigheten delades i vägverket och naturvårdsverket ... (UNT 970502 Familj enytt)

02 verb + preposition/adverb + att-clause

Den störtade zairiske ledaren äger bl a en palatsliknande vill a vid den franska medelhavskusten och en våning på en fashionabel adress nära Triumfbågen i Paris och det har spekulerats om att han nu tänker söka sin till flykt till det land som så länge hållit honom under armarna. / Den störtade zairiske ledaren äger bl a en palatsliknande vill a vid den franska medelhavskusten och en våning på en fashionabel adress nära Triumfbågen i Paris och det har spekulerats över

Page 63: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 52 –

att han nu tänker söka sin till flykt till det land som så länge hållit honom under armarna.(SvD Utrikes)

03 verb + preposition + infinitive phrase

Bo Pettersson har deltagit vid ett par av rånen men inte kunnat bindas vid att ha planerat dem. / Bo Pettersson har deltagit vid ett par av rånen men inte kunnat bindas till att ha planerat dem. (GS23ABC)

04 verb + adverb + NP

Minst en av pojkarna hann igen henne och fortsatte plågandet. / Minst en av pojkarna hann ifatt henne och fortsatte plågandet. (GS19A)

16 verb + adverb + preposition + NP

Så den som offrar sina lungor för looken, för att popstjärnan man är nere med gör det, för att det är så inihelvete häftigt att röka har all min sympati. / Så den som offrar sina lungor för looken, för att popstjärnan man är nere i gör det, för att det är så inihelvete häftigt att röka, har all min sympati. (SvD Kultur)

10 verb + adverb + PP

... skall de tre släppas i naturen ... /

... skall de tre släppas ut i naturen ... (UNT 970502 Uppland)

05 verb + pronoun + som + NP

Halvt om halvt gör de om det gamla men inte längre respektabla misstaget att uppfatta oss om födda vuxna. / Halvt om halvt gör de om det gamla men inte längre respektabla misstaget att uppfatta oss som födda vuxna. (CS4)

08 verb + noun + preposition

... som politi kerna avvaktar att ta ställning om ... /

... som politi kerna avvaktar att ta ställning till … (UNT 970408 Uppland)

14 verb + reflexive pronoun + preposition/adverb

... men det saknas låtar att bry sig i och det hela låter tomgång. /

... men det saknas låtar att bry sig om och det hela låter tomgång. (UNT 970416 Nöje)

09 verb + reflexive pronoun + preposition + NP

... reserverade sig emot beslutet ... /

... reserverade sig mot beslutet ... (UNT 970423 Uppland)

Specifications dealing with removing a word:

11 verb [no preposition or adverb]

... och vikten ökar snabbt upp igen. /

... och vikten ökar snabbt igen. (UNT 970421 För Dagen)

Page 64: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 53 –

06 verb + NP [no preposition or adverb]

Man kan också anklaga de ansvariga politi kerna för att de inte haft mod, kraft och beslutsam-het att stoppa upp projekt då de börjat gå snett. / Man kan också anklaga de ansvariga politi kerna för att de inte haft mod, kraft och beslutsam-het att stoppa projekt då de börjat gå snett. (UNT 961022 Debatt)

12 verb + infinitive phrase [no preposition or adverb]

... de vuxna som finns där är utbildade och väl ägnade åt att hantera barn i grupp. /

... de vuxna som finns där är utbildade och väl ägnade att hantera barn i grupp. (UNT 970304 Ledare)

13 verb + att-clause [no preposition or adverb]

Spårämnet selen, vårt 34:e grundämne, håller på nytt på att komma i centrum för intresset när det gäller att skydda mot sig cancersjukdomar. / Spårämnet selen, vårt 34:e grundämne, håller på nytt att komma i centrum för intresset när det gäller att skydda mot sig cancersjukdomar. (SvD Inrikes)

15 verb + adjective + NP [no preposition or adverb]

Flygledaren blev varse om vad som ... / Flygledaren blev varse vad som ... (UNT 970502 Ettan)

07 one preposition/adverb too many

– Barn måste kunna se upp till någon och det är de vuxna i det här landet som bestämmer till vem de ser upp till ! sade Clinton. / – Barn måste kunna se upp till någon och det är de vuxna i det här landet som bestämmer vem de ser upp till ! sade Clinton. (GS26A)

Preposition/adverb missing after verbs (MP) The verb should be followed by a preposition or an adverb, but is not. A lexicalised expression func-tioning as a verb is perceived as one unit, although the parts are stated in terms of the word categories to which they belong. Missing prepositions are also dealt with in the prepositional phrase category, but then the choice of preposition is not dependent on the preceeding verb. In some cases, the infinitive mark att is also missing beside the missing preposition.

05 verb + preposition/adverb + NP

Två tredjedelar av underskottet, 418 milj oner kronor, handlar så kallade medgivna överskrid-anden, som genom tidigare beslut finansieras med eget kapital. / Två tredjedelar av underskottet, 418 milj oner kronor, handlar om så kallade medgivna över-skridanden, som genom tidigare beslut finansieras med eget kapital. (SvD Stockholm)

01 verb + preposition/adverb + clause

Folkomröstningsresultat i all ära, men de som tvekar huruvida kärnkraften verkligen skall av-vecklas, och de som över huvud taget inte fick göra sin stämma hörd 1980 är nu så många att det borde få regeringen att reflektera. / Folkomröstningsresultat i all ära, men de som tvekar om huruvida kärnkraften verkligen skall avvecklas, och de som över huvud taget inte fick göra sin stämma hörd 1980 är nu så många att det borde få regeringen att reflektera. (UNT 961022 Ledare)

Page 65: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 54 –

09 verb + reflexive pronoun + preposition + NP

På nya skivan ger han sig förutom egna kompositioner låtar som Lennart Hellsings Trollkarlen ... / På nya skivan ger han sig förutom egna kompositioner på låtar som Lennart Hellsings Troll -karlen ... (UNT 970416 Nöje)

08 verb + reflexive pronoun + preposition + infinitive phrase

... beslutade hon sig snabbt att tacka nej. /

... beslutade hon sig snabbt för att tacka nej. (UNT 970410 Familj enytt)

02 verb + reflexive pronoun + noun + preposition + noun

Det har tagit sig uttryck bland annat p-pendeln ... / Det har tagit sig uttryck bland annat i p-pendeln ... (UNT 970415 Ledare)

07 verb + preposition + infinitive phrase [att may also be missing]

... räknar vi ta ut en hyra på 3 500 kr, vilket är lågt för ett nytt hus, säger ... /

... räknar vi med att ta ut en hyra på 3 500 kr, vilket är lågt för ett nytt hus, säger ... (UNT 970408 Uppland)

11 verb + adverb + preposition + NP

- Det håller jag också med. / - Det håller jag också med om. (UNT 970416 Uppland)

10 verb +adverb + preposition + att-clause

Vi har hört om forskare som efter en timmes föreläsning kring detta ämne kom fram att man inte vet. / Vi har hört om forskare som efter en timmes föreläsning kring detta ämne kom fram till att man inte vet. (SvD Inrikes)

03 verb +adverb + preposition + infinitive phrase [att may also be missing]

Inte minst går han till attack mot ett socialistparti som han anklagar för att vara ute förbereda nya pålagor och nya skattehöjningar. / Inte minst går han till attack mot ett socialistparti som han anklagar för att vara ute efter att förbereda nya pålagor och nya skattehöjningar. (SvD Utrikes)

12 verb + preposition + noun + infinitive phrase

Den urgamla svenska rätten att kunna få sin dom omprövad är väg att totalt avskaffas. / Den urgamla svenska rätten att kunna få sin dom omprövad är på väg att totalt avskaffas. (SvD Inrikes)

04 verb + reflexive pronun + som + NP

Alla liknelser med Larry Flint, porrtidningen Hustlers redaktör som ser sig en förkämpe för det fria ordet, slår Howard Stern ifrån sig, även om han också blivit stämd för förtal flera gånger. / Alla liknelser med Larry Flint, porrtidningen Hustlers redaktör som ser sig som en förkämpe för det fria ordet, slår Howard Stern ifrån sig, även om han också blivit stämd för förtal flera gånger. (SvD Kultur)

Page 66: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 55 –

06 verb + som + clause

När Henman på onsdagen slog in matchbollen mot titelhållaren Ricard Krajicek lät det ungefär när England gör ett viktigt mål på Wembley. / När Henman på onsdagen slog in matchbollen mot titelhållaren Ricard Krajicek lät det ungefär som när England gör ett viktigt mål på Wembley. (SvD Sport)

13 verb + noun + preposition

... " Uppsalafilosofin", lägger man ju stor vikt bl a begreppsanalys ... /

... " Uppsalafilosofin", lägger man ju stor vikt vid bl a begreppsanalys ...(UNT 970424 Debatt)

Repetition of preposition/adverb (RP) In coordination, for instance, the preposition should sometimes be repeated in the second phrase but is not. Problems of this kind belong to this repetition subcategory. The specification level states whether the coordinated phrases are of the same type or not.

01 phrases of the same type

Regeringen har mer eller mindre låtit förstå att man delar Jospins uppfattning och socialist-ledaren har sedan spätt ut budskapet genom att säga att det naturligtvis inte handlade om några nya vill kor från hans sida utan mera utgångspunkter för nya diskussioner. / Regeringen har mer eller mindre låtit förstå att man delar Jospins uppfattning och socialist-ledaren har sedan spätt ut budskapet genom att säga att det naturligtvis inte handlade om några nya vill kor från hans sida utan mera om utgångspunkter för nya diskussioner. (SvD Utrikes)

02 phrases of different types

Filmen handlar om att bli den jag vill e vara och alla dem som bekämpade mig. / Filmen handlar om att bli den jag vill e vara och om alla dem som bekämpade mig. (SvD Kultur)

4.2.8 Pronoun Case (PC)

The pronoun case category contains problems in choosing the correct case for a pronoun: the subjective form or the objective form. For doing that, verb construction may be of interest but also information about sentence structure. Therefore, pronoun case does not fall within the verb valency category nor the noun phrase category but within a separate category. When the wrong pronoun case is used, the incorrect pronoun seems not to be due to the chosen verb but to how the whole clause or sentence is constructed. Special cases, which might be interesting to separate from other similar cases, are when the pronoun is immediately followed by a relative pronoun, for instance som.

Subjective form correct (SF) An example of erroneous objective form not foloowed by a relative clause has not appeared in the material. To make the specification levels parallel between the two subcategories, the specification in the subjective form correct subcategory starts with 02.

02 objective form => subjective form, followed by a relative clause

För dem som verkligen såg och använde katalogen ... / För de som verkligen såg och använde katalogen ... (UNT 970306 Uppland)

Page 67: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 56 –

Objective form correct (OF)

01 subjective form => objective form

– Formerna är inte klara riktigt ännu, de utreder vi vidare, säger Göran Lindqvist, departement-sekreterare i kulturdepartementet. / – Formerna är inte klara riktigt ännu, dem utreder vi vidare, säger Göran Lindqvist, departe-mentsekreterare i kulturdepartementet. (GS24ABC)

02 subjective form => objective form, followed by a relative clause

Puritanerna, de första amerikanska nybyggarna under 1600-talet, framställs vanligen i sina höga hattar och med musketörer på axeln, som de som amerikanerna har att tacka för sina medborgerliga fri- och rättigheter. / Puritanerna, de första amerikanska nybyggarna under 1600-talet, framställs vanligen i sina höga hattar och med musketörer på axeln, som dem som amerikanerna har att tacka för sina medborgerliga fri- och rättigheter. (UNT 961022 Likt och Olikt)

4.2.9 Agreement (AG)

Agreement errors can turn up at different levels in a sentence. Those within a noun phrase are classified within the NP category, while those on clause level belong to this agreement category. Collective nouns may differ in grammatical number and semantic number. Therefore, collective nouns are separated from non-collective nouns on the specification level when such a division might give interesting information of agreement errors made. The subcategorisation is based on a combination of phrase grammar and functional grammar approaches – the phrases and their functions have been taken into account. Agreement between a noun phrase and an adjective phrase may in functional terms be an agreement between subject and complement (subjektivt predikativ), but also between object and complement (objektivt predikativ). These to cases have been separated in two different subcategories.

NP and AP – subject and complement (NA) Problems with the number feature are divided in different specifications so that problems with nouns in which the grammatical and semantic number may differ are separated from ordinary nouns. Problems with number in coordinated noun phrases are also addressed.

01 number in non-collective nouns

Men förutsättningen för att korta köerna är för närvarande ej särskil t stora. / Men förutsättningen för att korta köerna är för närvarande ej särskilt stor. (SvD Stockholm)

02 number in collective nouns

Den norska polisen är försiktiga med att gå ut med detaljerade upplysningar om händelserna som ledde till den lill a flickans död i Heimdalen vid Trondheim. / Den norska polisen är försiktig med att gå ut med detaljerade upplysningar om händelserna som ledde till den lill a flickans död i Heimdalen vid Trondheim. (GS19A)

07 number in coordinated noun phrases

Vårt kulturarv och vår historia måste bevaras och vara till gängligt för alla, eller är de utrotningshotade som allt annat ... / Vårt kulturarv och vår historia måste bevaras och vara till gängliga för alla, eller är de utrotningshotade som allt annat ... (UNT 19970410 Läsarnas Forum)

Headings follow a somewhat different grammar than ordinary texts. For instance, copulas are often left out. Another analysis is that the adjective phrase is a postmodifier of the noun. While the latter analysis is the most apporpriate for ordinary text, the former is more suitable concerning headings.

Page 68: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 57 –

06 number in heading without copula

Uppsalabo nöjda med nya UNT / Uppsalabor nöjda med nya UNT (UNT 19970423 Uppsala)

Gender agreement problems would be very unproblematic if it was not for the possible non-agreement for nouns with general, abstract meaning such as collective nouns and material nouns. The same noun may in one context be general and in another context specific (cf. Hallon är gott – Hallon är röda). Gender problems of this kind is specified in 04 below.

03 gender

Stämningen var mycket hätskt i hallen, stundtals liknade det mer krig än idrott. / Stämningen var mycket hätsk i hallen, stundtals liknade det mer krig än idrott. (RS32)

04 gender in specific/general meaning

Väntande taxi bli r för dyrt. / Väntande taxi bli r för dyr. (UNT 970422 Debatt)

Höstens modefärg bli r brun … / Höstens modefärg bli r brunt … (UNT 970219 För Dagen)

A special case of agreement between NP and AP occurs in relational clauses in which the relative pronoun functions as the subject. This problem involves both a referential diff iculty and an agreement error, but is dealt with in this agreement subcategory.

05 head noun/relative pronoun and AP in relative clause

Det är rektors och dekanernas uppgift att vårda denna gemensamhetskänsla som så länge universiteten är relativt autonoma även är viktiga för samhället i övrigt. / Det är rektors och dekanernas uppgift att vårda denna gemensamhetskänsla som så länge universiteten är relativt autonoma även är viktig för samhället i övrigt. (UNT 970218 Ledare)

NP and AP – object and complement (NO) As in the former subcategory, the agreement between a noun phrase and an adjective phrase is in focus. The difference is stated in functional terms. In this subcategory, the noun phrase is an object and the adjective phrase is a complement to that object instead of the subject.

01 gender

... hur viktigt hon ansåg denna förutsättning vara. /

... hur viktig hon ansåg denna förutsättning vara. (UNT 970414 Uppsala)

02 species

... fann jag och min syster det säkraste att fly undan. /

... fann jag och min syster det säkrast att fly undan. (UNT 970502 Familj enytt)

AP and AP – subject and complement (AA) An adjective may replace a noun phrase and thus function as a subject. The complement should agree with the subject. (In the example, the number of the adejctive functioning as subject is dependent on the phrase Bra vanor. However, the error may be detected by narrowing the context to the last clause.)

01 number

Bra vanor är svåra att behålla medan dålig är lätta ... / Bra vanor är svåra att behålla medan dåliga är lätta ... (UNT 970421 För Dagen)

Page 69: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 58 –

NP and perfect participle – subject and complement (NE) Participles are perceived as verb forms, thus not forming adjective phrases. Agreement problems between an NP and a participle concern gender, number and person.

01 gender

VHS har i dag uppdrag från statsmakterna att svara för denna men uppgiften är inte närmare preciserat. / VHS har i dag uppdrag från statsmakterna att svara för denna men uppgiften är inte närmare preciserad. (GS28A)

02 number

... att tandvårdspersonalen vid distriktstandvårdskliniken Vretgränd 18 agerat föredömligt och korrekt genom att hjälpa patienter med akuta besvär och så snart som möjli gt informera er om att man tyvärr blivit försenade och hur långvarig förseningen beräknades bli . / ... att tandvårdspersonalen vid distriktstandvårdskliniken Vretgränd 18 agerat föredömligt och korrekt genom att hjälpa patienter med akuta besvär och så snart som möjli gt informera er om att man tyvärr blivit försenad och hur långvarig förseningen beräknades bli . (UNT 961022 Läsarnas Forum)

03 person

... en ny klubb som gör att jag kan tända till och bli motiverat, konstaterar ... /

... en ny klubb som gör att jag kan tända till och bli motiverad, konstaterar ... (UNT 970408 Ettan)

NP and pronoun – subject and complement (PN) A pronoun as a complement has to agree with the subject just as the adjective phrase has to. The corrections have not been taken into consideration on the specification level.

01 number

Vilken är de bästa låtar du komponerat? / Vilka är de bästa låtar du komponerat? (SvD Kultur)

NP and NP – subject and complement (NP) Both subject and complement may be formed by noun phrases which should agree with each other.

01 number

Hennes stora intresse är hundar och hantverk. / Hennes stora intressen är hundar och hantverk. (UNT 970429 Familj enytt)

NP and NP in ” som” phrases – subject and complement (NS) In certain constructions with som, the noun following som should agree with the subject of the clause. (See Teleman 1974, p. 59 for a further discussion.)

01 number

Det hängde mycket manligt testosteron i luften när fem ansvariga på Stockholms brandförsvar berättade hur 80 kvinnliga aspiranter testats för att få utbildning som brandman. / Det hängde mycket manligt testosteron i luften när fem ansvariga på Stockholms brandförsvar berättade hur 80 kvinnliga aspiranter testats för att få utbildning som brandmän. (SvD Stockholm)

Page 70: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 59 –

02 gender

De mindre högskolorna framställde en delning i uppdraget som progressivt och angav att en sådan "kändes riktig". / De mindre högskolorna framställde en delning i uppdraget som progressiv och angav att en sådan "kändes riktig". (UNT 970218 Ledare)

NP and NP – object and complement (NN) As in the subcategory above, a noun in a so called som-phrase should agree with another noun, here functioning as the object.

01 number

Han tänker då föreslå OS-bolaget och Stockholms stad som tänkbar delfinansiär. / Han tänker då föreslå OS-bolaget och Stockholms stad som tänkbara delfinansiärer. (SvD Stockholm)

4.2.10 Referential Problems (RP)

Reference problems within the sentence is the topic of this category. There are two subcategories dealing with two different kinds of problems: pronoun reference and a kind of verbal reference.

Pronoun reference (PN) A pronoun should agree in number and gender with its antecedant. This subcategory includes problems in choosing the proper reflexive pronoun in reflexive constructions. The specification level states if the pronoun is referring to something previous in the sentence (anaphoric reference) or to something to come (deictic reference).

01 anaphoric reference

Rökarna är förvisade till ett litet hörn av baren där man knappt kan se bandet, än mindre höra dem. / Rökarna är förvisade till ett litet hörn av baren där man knappt kan se bandet, än mindre höra det. (SvD Kultur)

02 deictic reference

– Vi vill gärna få in förslag från allmänheten om vilken de anser bör bli årets Häveröbo, säger Anita Dahlberg. / – Vi vill gärna få in förslag från allmänheten om vem de anser bör bli årets Häveröbo, säger Anita Dahlberg. (UNT 970408 Uppland)

Choice of VF (VF) Sometimes a correct verb phrase in the limited sense is changed by the proof-reader. One reason may be that the phrase is coordinated with another verb phrase and that they ought to have the same tense. Another reason may be that the subordinate clause imposes a condition so that the main clause should be in a certain form.

01 conditional subordinate clause

Om Medanalysaffären inträffat i år, 1997, skulle socialstyrelsen kunna agera på ett betydligt mer självständigt och tuffare sätt. / Om Medanalysaffären inträffat i år, 1997, skulle socialstyrelsen ha kunnat agera på ett betyd-ligt mer självständigt och tuffare sätt. (SvD Inrikes)

Page 71: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 60 –

02 comparative subordinate clause

Jag klarade puttningen lättare än jag trodde ... / Jag klarade puttningen lättare än jag hade trott ... (UNT 970415 Sporten)

03 consistency

Men nu visade det sig att det inte bara är staket det handlade om. / Men nu visade det sig att det inte bara var staket det handlade om. (UNT 970416 Uppland)

04 combination of verb form and temporal adverbial

Den bilden bekräftas igår ... / Den bilden bekräftades igår ... (UNT 970410 Ledare)

4.2.11 Word Order (WO)

The word order on clause level is the issue in this grammar category. The subcategorisation has been based on what word categories are involved in the word order shift. Since more than one word category or phrase type are concerned, a hierarchy between the subcategories is needed: A problem belongs to the subcategory first mentioned in the order below. For instance, a word order problem involving an adverb and a noun is classified as an adverb phrase problem rather than a noun phrase problem.

Inversion (IN) Inversion takes place when the finite verb preceedes the subject of the clause. The word order shift thus involves the finite verb and a noun phrase. The specifications do not state what causes the inversion, only if the inverson is correct or incorrect.

01 inversion => not inversion

När man inte frågar sig vad Sveriges land och dess invånare behöver, utan i stället hur mycket skall en organisation få kosta /.../ då är det riktigt ill a. / När man inte frågar sig vad Sveriges land och dess invånare behöver, utan i stället hur mycket en organisation skall få kosta /.../ då är det riktigt ill a. (UNT 970306 Debatt)

02 not inversion => inversion

På det här utrymmet vi kommer ge plats åt ... / På det här utrymmet kommer vi ge plats åt ... (UNT 970422 Nöje)

Inserted phrase (IP) Where to put an inserted phrase is another word order problem. The main issue is if the phrase ought to stand after rather than before the finite verb.

01 before => after the finite verb

Det troliga enligt Ines Uusmann är att sjöfartsverket beslutar att skicka ner dykare. / Det troliga är, enligt Ines Uusmann, att sjöfartsverket beslutar att skicka ner dykare. (GS2A)

Adverb phrase (AB) Where to put an adverb phrase is the question addressed in this subcategory. The specifications state what type of word category or phrase the adverb(s) shift position with.

Page 72: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 61 –

01 noun phrase

Det ansågs ännu för tidigt att massmedicinera stora grupper friska kvinnor trots de uppenbara fördelarna vad gäller skydd mot hjärtsjukdomar och benskörhet framför allt . / Det ansågs ännu för tidigt att massmedicinera stora grupper friska kvinnor trots de uppenbara fördelarna vad gäller skydd mot hjärtsjukdomar och framför allt benskörhet. (SvD Inrikes)

02 preposition

... en kvinnlig biskop kan bli en viktig förebild för inte bara kvinnliga teologer ... /

... en kvinnlig biskop kan bli en viktig förebild inte bara för kvinnliga teologer ... (UNT 970412 Ledare)

06 prepositional phrase

– Jag vill e naturligtvis salutera min SM-triumf med att köra först över målli njen av oss båda. / – Jag ville naturligtvis salutera min SM-triumf med att köra över målli njen först av oss båda. (SvD Sport)

03 finite verb

Det krävs omfattande studier för att kartlägga detta fenomen, där till gången på ett eller flera läkemedel som skyddar mot metastaser skulle avsevärt underlätta situationen. / Det krävs omfattande studier för att kartlägga detta fenomen, där till gången på ett eller flera läkemedel som skyddar mot metastaser avsevärt skulle underlätta situationen. (GS16A)

04 infinite verb

Det går alltså inte att säga just nu exakt hur många nya studieplatser ... / Det går alltså inte att just nu säga exakt hur många nya studieplatser ... (UNT 970416 Sverige)

05 adverb governed by a verb

I Sverige föds strutsar fortfarande främst upp för köttets skull . / I Sverige föds strutsar fortfarande upp främst för köttets skull . (UNT 970422 Uppsala)

Noun phrase (NP) Problems involving noun phrases have already been addressed in the inversion subcategory and in the adverb phrase subcategory.

01 reflexive pronoun

Också i sin forskning rörde sig han framför allt i Dalarna ... / Också i sin forskning rörde han sig framför allt i Dalarna ... (UNT 970422 Familj )

02 infinite verb

Denna eld av konverterad rädsla till il ska identifierades redan av Constantine "Cus" d´Amato, Tysons beskyddare i Catskill s, New York från 13 års ålder. / Denna eld av rädsla konverterad till il ska identifierades redan av Constantine "Cus" d´Amato, Tysons beskyddare i Catskill s, New York från 13 års ålder. (SvD Sport)

Page 73: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 62 –

Prepositional phrase (PP)

01 infinitive phrase

Folkpartiet har ett stolt arv att föra vidare på det här området och dagens folkpartiledare Lars Leijonborg tycks ha börjat. / Folkpartiet har ett stolt arv på det här området att föra vidare och dagens folkpartiledare Lars Leijonborg tycks ha börjat. (UNT 970408 Ledare)

02 finite verb

... när vi tvingas av ekonomiska skäl sänka kostnaderna så mycket som vi nu håller på med i landstinget. / ... när vi av ekonomiska skäl tvingas sänka kostnaderna så mycket som vi nu håller på med i landstinget. (UNT 970408 Debatt)

03 finite verb + adverb

Risken är bara för Torypartiet att ... / Risken för Torypartiet är bara att ... (UNT 970423 Ledare)

05 finite verb + noun phrase

... omsorgsnämndens prognostiserade underskott på drygt 14 milj oner kronor i Tierp. /

... omsorgsnämndens i Tierp prognostiserade underskott på drygt 14 milj oner kronor. (UNT 970417 Uppland)

06 infinitive mark

... går inte i ord att beskriva. /

... går inte att i ord beskriva. (UNT 970429 Läsarnas Forum)

04 prepositional phrase

... en föreställning i biografen på måndagskvällen på den scen ... /

... en föreställning på måndagskvällen i biografen på den scen ... (UNT 970421 Uppland)

Other word order problems (OP) Problems with certain constructions fall within this subcategory. Even other kinds of word order problems that do not fit in any of the subcategories above belong here, such as instances in which more than two constituents are involved.

01 både ... och ...

Det skall dock noteras att stöd för några av projekten hämtats både hos folkpartiet och centern. / Det skall dock noteras att stöd för några av projekten hämtats hos både folkpartiet och centern. (UNT 961022 Debatt)

02 såväl … som …

Hon svarade såväl för solosång som ledning av kören. / Hon svarade för såväl solosång som ledning av kören. (UNT 970408 Uppland)

Page 74: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 63 –

03 other problems

Eventuellt kommer en speciell enhet att bildas inom departementen, men åtminstone kommer regeringen att ge den en direkt politi sk ledning. / Eventuellt kommer en speciell enhet att bildas inom departementen, men regeringen kommer åtminstone att ge den en direkt politi sk ledning. (GS24A)

4.2.12 Wrong Word Category (WC)

Word category errors belonging to this category in the typology occur in words at clause level. The erroneous words should not be recognised as a part of a phrase to be classified here, otherwise the error should be dealt with in the proper phrase category. This includes erroneous prepositions in prepositional phrases. The correct word categories form the subcategories, and the incorrect word categories form the specifications. When an erroneous word may be ascribed more than one word class, the specification will be other.

Adjective (AV)

01 verb

Jakthistorier är det gått om. / Jakthistorier är det gott om. (UNT 970419 Uppland)

02 preposition

Kvarterskrog med exklusive meny. / Kvarterskrog med exklusiv meny. (UNT 970418 Uppsala)

Adverb (AB)

01 noun

Kollektivanslutningen blev kar, men i en annan form. / Kollektivanslutningen blev kvar, men i en annan form. (UNT 970304 Debatt)

02 verb

Nej, naturligtvis var det vara miss Willi ams som dög. / Nej, naturligtvis var det bara miss Willi ams som dög. (SvD Sport)

03 adjective

Unison sjöngs O hur saligt att få vandra. / Unisont sjöngs O hur saligt att få vandra. (UNT 970422 Familj )

05 preposition

Var skulle man få det från? / Var skulle man få det ifrån? (UNT 970410 Uppsala)

04 other

... är även han lite försiktig om vad han tror laget hamnar i serien. /

... är även han lite försiktig om var han tror laget hamnar i serien. (UNT 970416 Sporten)

Page 75: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 64 –

Pronoun (PN)

01 other

Både är fundamentalistiska ... / Båda är fundamentalistiska ... (UNT 970428 Debatt)

4.2.13 Other Grammar Problems (OG)

Other grammatical problems are those problems that are diff icult to fit in any other category or that are of a grammatical kind but diff icult to formalise. Abbreviations form a subcategory in which problems with erroneous abbreviations are addressed. Other errors involving abbreviations are spelli ng errors (that are totally context independent) and style problems (for instance choosing between correct forms).

Coordinations (CO) Problems with coordinating phrases which do not fit in any other category are dealt with here. Asymmetric coordination is one example of erroneous coordination, and it occurs when the coordinated constituents are of different grammatical types (the example lacks a corrected version).

I inbjudan får arkitekterna besked om läge och topografiska förhållanden och se bilder på Vitlyckehällen, Aspeberget, Fossum och Litsleby. (GS9BC)

Word missing (WM) Two words with identical ortography but with different meanings and usage appearing after each other in a sentence might seem to be a doubled word, that is a word written twice by mistake, but here one of the words is missing. However, there might be other words missing which are diff icult to classify within any of the other grammar categories. In the example below, the word de might be a personal pronoun or the definite article belonging in the following noun phrase.

Människor längs Stockholms gator ger även de omkomna sin tysta hyllning. / Människor längs Stockholms gator ger även de de omkomna sin tysta hyllning. (GS12BC)

Doubled words (DW) Doubled words problems that are not dealt with in any other category belong here. Occasionally more than one word are doubled.

På Fredmans pub i Uppsala är det inte det inte långt mellan borden för icke-rökare och rökare. / På Fredmans pub i Uppsala är det inte långt mellan borden för icke-rökare och rökare. (UNT 961025 Ettan)

Heading (HE) There are places within the text where a heading should not be placed, for instance between a colon and a statement.

Strange syntax and other grammatical problems (OP) All other grammatical problems are classified in this subcategory.

Page 76: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 65 –

4.3 Punctuation Problems (PU)

The following signs are treated as punctuation marks: points, commas, dashes within the sentence, question marks, exclamation marks, colons, and semicolons. Graphical problems, the next error group, contains errors that might be seen as punctuation errors. The division has been based on what signs are involved and what they mark. Quotation marks and parentheses are conceived of as typographical entities rather than punctuation marks. Dashes within the sentence occur as a category in both groups: problems with dashes are punctuation problems when it the function of the dashes that are in focus, and they are graphical problems when the focus is on the typographical sign used. When there is a choice to be made which sign to use, the problem belongs to the style, meaning, and reference group. Capital letter in the beginning of a sentence and end of sentence punctuation are closely related problems. Since the capital letter is dependent on the context, it cannot be seen as a spelli ng problem like other capital letter errors. There are seven categories in the punctuation problems group:

· End of Sentence Punctuation (ES)

· Capital Letter (CP)

· Comma (CO)

· Dash within the Sentence (DW)

· Colon (CN)

· Semicolon (SN)

· Other Punctuation Problems (OP) The principal idea when classifying punctuation errors is to look at the corrected version. This is though not applicable when it comes to end of sentence punctuation but it is the guideline for all other punctuation marks. So, in cases where a comma should be replaced by a colon, the error falls within the colon category, and vice versa. When the punctuation mark should be removed and not replaced with another mark, the incorrect punctuation mark forms the basis for the classification.

4.3.1 End of Sentence Punctuation (ES)

The end of sentence punctuation category includes problems with missing end of sentence punctuation, choice of punctuation mark, missing capital letter at the beginning of a sentence, and erroneously inserted punctuation marks (not end of sentence). Other problems addressed are doubled punctuations marks and problems with combinations of punctuations marks and quotations marks or parentheses. The colon constitutes a certain problem, because it may be perceived as an end of sentence mark if the next sentence starts with a capital letter. This view is adopted in the typology.

Punctuation mark missing (PM) The error specification for missing punctuation mark depends on what punctuation mark should be used.

01 point / full stop

... en tanke som särskilt feministfilosofer onhuldar, ibland utan att själva veta om det De bidragsgivare som ger sig på deontologi och teologi tycks till sagda att hålla sig till vissa aspekter. / ... en tanke som särskilt feministfilosofer onhuldar, ibland utan att själva veta om det. De bidragsgivare som ger sig på deontologi och teologi tycks till sagda att hålla sig till vissa aspekter. (CS4)

02 question mark

Men också premiärministern dundrar ju om ”mer fördömande och mindre förståelse” / Men också premiärministern dundrar ju om ”mer fördömande och mindre förståelse”? (GS6C)

Page 77: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 66 –

03 exclamation mark

Rid i vägkanten / Rid i vägkanten! (UNT 970424 s3)

Choice of end of sentence punctuation (EC) The problems in this particular subcategory deal with the choice between point and other signs, such as colon but also signs that do not mark end of sentence such as hyphen. Colon can be perceived as marking end of sentence, and there are several norms guiding whether the next sentence ought to begin with a capital letter. Colon is seen as a sentence divider when the next sentence begins with a capital letter. The specificaiton state the erroneous sign and the correct one.

01 point => colon

Den enda slutsats som man kan dra är följande. Stoppa vansinnet i tid! / Den enda slutsats som man kan dra är följande: Stoppa vansinnet i tid! (UNT 961022 Debatt)

02 point => exclamation mark

Den enda slutsats som man kan dra är följande: Stoppa vansinnet i tid. / Den enda slutsats som man kan dra är följande: Stoppa vansinnet i tid! (UNT 961022 Debatt)

03 point => question mark

Kan inte ordföranden /.../ vara skild från rektor. / Kan inte ordföranden /.../ vara skild från rektor? (UNT 970218 Ledare)

09 point => three dots

Från bokbinderi till t ypografi, sadelmakari till batiktryck. / Från bokbinderi till t ypografi, sadelmakeri till batiktryck . . . (SvD Kultur)

04 colon => point

De dyra vanorna är ett av de största hindren när man ska rehabilit era prostituerade: / De dyra vanorna är ett av de största hindren när man ska rehabilit era prostituerade. (UNT 970409 För Dagen)

05 exclamation mark => point

Inte minst med tanke på att Sverige tar plats i säkerhetsrådet vid årsskiftet! / Inte minst med tanke på att Sverige tar plats i säkerhetsrådet vid årsskiftet. (SvD Inrikes)

06 question mark => point

Frågan är om och i sådana fall var /.../ få en lönsam inrikesroute? / Frågan är om och i sådana fall var /.../ få en lönsam inrikesroute. (UNT 970416 Sverige)

07 question mark => exclamation mark

Tank på det mjuka vägunderlaget? / Tänk på det mjuka vägunderlaget! (UNT 970424 s3)

Page 78: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 67 –

10 comma => point

... Diana Hackå, Nedre raden ... /

... Diana Hackå. Nedre raden ... (UNT 970430 Sport)

11 comma => exclamation mark

Och ve kritikerna, eller med näringsministerns ord: ansvaret skall vila tungt på dem som "sprider en mörk blid av Sverige". / Och ve kritikerna! Eller med näringsministerns ord: ansvaret skall vila tungt på dem som "sprider en mörk bild av Sverige". (SvD Ledare)

08 hyphen => point

... i en kommande bok- Utgångspunkten för denna ... /

... i en kommande bok. Utgångspunkten för denna ... (UNT 970219 Kultur)

Full stop together with quotation marks or parentheses (FS) To decide which to come first, the full stop or the quotation mark, one needs to know if the whole sentence is a citation or only if a part of it is. The same goes for full stop and parentheses.

01 citation within the sentence

Följden är att många lärare, i synnerhet i landsorten, inte har fått sin lön betald eller blivit avspisade med "vita papper." / Följden är att många lärare, i synnerhet i landsorten, inte har fått sin lön betald eller blivit avspisade med "vita papper". (MS44)

03 whole sentence is a citation

” I februari (!) 1477 seglade jag 100 leagues bortom Thule till en ö, som ligger på 75 grader” . / ” I februari (!) 1477 seglade jag 100 leagues bortom Thule till en ö, som ligger på 75 grader.” (CS4)

04 parentheses within the sentence

Men förutsätta i en motivtext är en sak, ge norm i lag en annan (vilket senast visade sig genom regeringsrättens beslut om Norra länken i Stockholm.) / Men förutsätta i en motivtext är en sak, ge norm i lag en annan (vilket senast visade sig genom regeringsrättens beslut om Norra länken i Stockholm). (SvD Ledare)

02 whole sentence within parentheses

(Se min understreckare av den 30/6 1992). / (Se min understreckare av den 30/6 1992.) (CS3)

One punctuation mark too many (PT) Some sentences have double punctuation marks. The error specification state the erroneous combination and the correct mark. The order between the marks is of no relevance for the error type code. A quotation mark may also occur between them.

01 point + question mark => question mark

(Hur mår ni nu era satungar?). / (Hur mår ni nu era satungar?) (GS6ABC)

Page 79: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 68 –

02 comma + point => point

Den nya utbildningen har emellertid fått elevkritik,. En ettårig påbyggnadskurs för dem som gått den femåriga utbildnigen hade varit bättre, menade de. / Den nya utbildningen har emellertid fått elevkritik. En ettårig påbyggnadskurs för dem som gått den femåriga utbildnigen hade varit bättre, menade de. (GS27A)

03 point + point => point

”Cragg Hardaway, 16, uppgav i rätten att han var oskyldig till dödsskjutningen på Robert Sandifer, 11, som kallades ’Yummy’ f ör att han tyckte om kakor och som var efterlyst för mordet på Shavon Dean, 14.” . / ”Cragg Hardaway, 16, uppgav i rätten att han var oskyldig till dödsskjutningen på Robert Sandifer, 11, som kallades ’Yummy’ f ör att han tyckte om kakor och som var efterlyst för mordet på Shavon Dean, 14.” (GS26AB)

04 point + exclamation mark => exclamation mark

... och skrek: "Polisen slog mig, polisen slog mig!". /

... och skrek: "Polisen slog mig, polisen slog mig!" (UNT 970419 Uppsala)

Not end of sentence (NE) A point has incorrectly been put in a sentence, and the following letter is not a capital letter. There are two possibiliti es: the point should be removed or changed, or the next letter should be in the upper case. If the latter alternative is the correct one, the error belongs to the subcategory of capital letter in next sentence. If the former alternative is the correct one, the error falls within the present subcategory. The specification is based on the erroneous punctuation mark and the correct one. Problems with points in abbreviations and number expressions are addressed in the style, meaning, and reference group. Choice between a comma and an exclamation mark or a question mark is also dealt with in the end of sentence punctuation group, even in cases where they are not followed by a capital letter since the latter marks are usually considered to show the end of the sentence.

01 incorrect point should be removed

De stora klassiska kristna teologerna gör onekligen det. (t ex Augustinus och Thomas ab Aquino). / De stora klassiska kristna teologerna gör onekligen det (t ex Augustinus och Thomas ab Aquino). (CS3)

02 point => comma

En orsak kan vara den snabba hjälpen från krisgruppen. tror Attle Diregrov. / En orsak kan vara den snabba hjälpen från krisgruppen, tror Attle Diregrov. (GS6A)

04 question mark => comma

Är det rimligt att samarbete med EU-kommissionen ska ge företag rabatt på böter? undrade flera upprörda advokater under den inledande förhandlingen. / Är det rimligt att samarbete med EU-kommissionen ska ge företag rabatt på böter, undrade flera upprörda advokater under den inledande förhandlingen. (SvD Näringsliv)

05 exclamation mark => comma

Om Stora tar pengarna ur den ena fickan eller den andra för att betala böterna har faktiskt mindre betydelse! hävdade kommissionens företrädare. / Om Stora tar pengarna ur den ena fickan eller den andra för att betala böterna har faktiskt mindre betydelse, hävdade kommissionens företrädare. (SvD Näringsliv)

Page 80: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 69 –

06 comma => question mark

– Vad gör du, frågade kungen ... / – Vad gör du? frågade kungen ... (UNT 970417 Uppsala)

03 other

Kända operakörer framförs bl a Bizets Habanera. Verdis triumfmarsch. / Kända operakörer framförs bl a Bizets Habanera och Verdis triumfmarsch. (UNT 970419 Uppsala)

Other end of sentence punctuation problems (OP) Problems with end of sentence punctuation that do not fit into any of the other categories belong here. No specification is made.

Varför har förändrade kvinnoroller gett så lite utslag i reklamen?, stereotyperna är i stort sett desamma sedan årtionden till baka. / Varför har förändrade kvinnoroller gett så lite utslag i reklamen? Stereotyperna är i stort sett desamma sedan årtionden till baka. (SvD Kultur)

4.3.2 Capital Letter (CP)

A sentence should (with a few exceptions) begin with a capital letter. The subcategorisation is primarily based on the preceeding punctuation marks. Ordinary words and not standing first in the sentence ahould not begin with a capital letter. Errors of this kind are dealt with here as well i n the subcategory of not beginning of sentence.

Point (PT) A sentence ends with a point, but the next sentence does not begin with a capital letter. Some words should not have a capital letter, even if they start a sentence (e.g. de in names). Most of the times, however, such a combination is incorrect. There are two possible solutions: the point should be removed or changed, or the next sentence should begin with a capital letter. The latter alternative is classified here (no further specification is made). If the former alternative is the proper one, the error belongs to the cate-gory of end of sentence punctuation. If the point is removed and not replaced, the error belongs to the not end of sentence subcategory within the end of sentence category.

Kvarstår år 1991, efter Sovjetunionens fall , att ..., all rahelst efter kommunismens död. anled-ningen är främst att alla motståndskämpar som samarbetade med fienden riskerade att sätta tyska soldaters liv på spel – fäder och söner. / Kvarstår år 1991, efter Sovjetunionens fall , att ..., all rahelst efter kommunismens död. Anled-ningen är främst att alla motståndskämpar som samarbetade med fienden riskerade att sätta tyska soldaters liv på spel – fäder och söner. (CS2)

Colon (CN) There are different norms for deciding whether a sentence or an expression after a colon should begin with a capital letter or not, and these norms are not always identical with the opinions of Svenska språknämnden. Errneous capital letter after colon is also dealt with in this subcategory. The specifications state the correct form of the letter.

01 capital letter => no capital letter

Några timmar tidigare, ute i Värtahamnen: Morgonen är kall , men mycket vacker. / Några timmar tidigare, ute i Värtahamnen: morgonen är kall , men mycket vacker. (GS12A)

Page 81: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 70 –

02 no capital letter => capital letter

... en pjäs som problematiserar frågorna: när prostituerar man sig? /

... en pjäs som problematiserar frågorna: När prostituerar man sig? (UNT 970409 För Dagen)

Quotation (QN) A direct statement within quotation marks may begin with a capital letter, even though it does not start a new sentence.

01 no capital letter => capital letter

I stället för att deppa måste man tänka, "jag sätter nästa". / I stället för att deppa måste man tänka, "Jag sätter nästa". (UNT 970415 Sporten)

Not beginning of sentence (NO) This subcategory deals with ordinary words erroneously written with capital letters even though the words are not beginning the sentences.

01 capital letter => no capital letter

Englandsettorna Cardigans är från Jönköping, De engelska rockkritikernas älsklingar Wanna-dies från Skellefteå och Fireside, med lollapalooza-turnén och skivkontrakt med Def American under bältet, är från Luleå. / Englandsettorna Cardigans är från Jönköping, de engelska rockkritikernas älsklingar Wanna-dies från Skellefteå och Fireside, med lollapaloozaturnén och skivkontrakt med Def American under bältet, är från Luleå. (SvD Kultur)

4.3.3 Comma (CO)

Where to put and where not to put commas are the main problems dealt with in this subcategory. There are a number of rules to be followed, and violation of these rules render an error classified as belonging to one of the following subcategories. The classification of erroneous usage of commas is inspired by Svenska skrivregler.

Main clauses (MC) When main clauses are coordinated without any shared element, a comma should occur.

01 coordination of main clauses

Finns det till räckligt med kylkapacitet för att förvara kropparna och var skall fartyget läggas? / Finns det till räckligt med kylkapacitet för att förvara kropparna, och var skall fartyget läggas? (GS2ABC)

Subordinate clause (SC) If the subordinate clause is a necessary one, a comma should not occur. If it is not a necessary subordinate clause, a comma is appropriate.

01 necessary subordinate clause

Börje Stenström talar om att vattentrycket kan ha varit så starkt, att det slagit in hyttdörrar och fönster. / Börje Stenström talar om att vattentrycket kan ha varit så starkt att det slagit in hyttdörrar och fönster. (GS15AC)

Page 82: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 71 –

02 not necessary subordinate clause

En förutsättning för det är ved- och fliseldning vilket i sin tur leder till ... / En förutsättning för det är ved- och fliseldning, vilket i sin tur leder till ... (UNT 970415 Ledare)

Phrases / units (PH) When a comma is improper between phrases or units, the error belongs to this subcategory. Phrases or units can be of different kinds, each given its own error specification. Shared units are those constituents that are common for, say, coordinated phrases, and they should not be surrounded by commas. Without a necessary unit the clause is incomplete, and there should be no commas around such a unit. Inserted units (inskott), though, are optional and ought to be surrounded by commas. Units that are not necessary for making the clause syntactically correct, but are yet not inserted units, ought not to be surrounded by commas.

01 shared unit

När visiret lossnade rörde det sig kraftigt, och drog därmed ut rampen. / När visiret lossnade rörde det sig kraftigt och drog därmed ut rampen. (GS15ABC)

02 necessary unit

En värdig mellanlandning, vill Stockholms domprost Caroline Krook kalla högtiden. / En värdig mellanlandning vill Stockholms domprost Caroline Krook kalla högtiden. (GS3AB)

03 inserted unit

Även Gunvor Bengtsson, lärare i matematik, fysik och data är positiv till omdaningen. / Även Gunvor Bengtsson, lärare i matematik, fysik och data, är positiv till omdaningen. (GS25AB)

04 wrongly assumed inserted unit

Vi vet nu att till växthormonet, GH, stimulerar bildande av ben. / Vi vet nu att till växthormonet GH stimulerar bildande av ben. (GS8A)

Parts of phrases / units (PA) Violations of rules for putting commas within a phrase or a unit fall within this subcategory.

01 erroneous comma in attributes

Målet är att minska ryckigheten och det gör att vi söker en bred, poli tisk lösning. / Målet är att minska ryckigheten och det gör att vi söker en bred politi sk lösning.(GS14ABC)

02 erroneous comma in ”enumerations” (uppräkningar)

Utredarna har haft hjälp av ligaledarens närmaste man, Johan Ahlin, av Erik Gröndahl, och av Carl Sumonjas flickvän. / Utredarna har haft hjälp av ligaledarens närmaste man, Johan Ahlin, av Erik Gröndahl och av Carl Sumonjas flickvän. (GS23ABC)

03 missing comma in attributes

... på fyra fem meters djup. /

... på fyra, fem meters djup. (UNT 970304 Ettan)

Page 83: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 72 –

04 missing comma in ”enumerations” (uppräkningar)

Svenskarnas febrila resande håller i sig över jul- nyår- och trettonhelgerna. / Svenskarnas febrila resande håller i sig över jul-, nyår- och trettonhelgerna. (SvD Inrikes)

” Clarity criteria” (CC) Comma rules do not only concern the functions of phrases or units in the clause. Commas can be put in a sentence to make it easier to be read and understood. No further specification is made.

Tingsrätten valde att ta hänsyn till David Sumonjas ungdom och gav honom endast fem års fängelse trots att han deltagit i bland annat sju grova rån och inte hjälpt till i utredningen. / Tingsrätten valde att ta hänsyn till David Sumonjas ungdom och gav honom endast fem års fängelse, trots att han deltagit i bland annat sju grova rån och inte hjälpt till i utredningen. (GS23ABC)

Comma instead of word (IW) A prepositional phrase may be changed into an inserted unit surrounded by commas.

Professor Olof Pettersson vid Statsvetenskapliga institutionen vid Uppsala universitet har valts till ... / Professor Olof Pettersson vid Statsvetenskapliga institutionen, Uppsala universitet, har valts till ... (UNT 970304 Uppsala)

Comma correct (CO) When other punctuation marks are changed into commas, the problems belong here except for points which belong to the category of end of sentence punctuation. The specification is based on the incorrect marks that ought to be changed.

01 semicolon => comma

Alla klassiska sportbilars gemensamma karaktärsdrag är ju just det udda; lite oväntade. / Alla klassiska sportbilars gemensamma karaktärsdrag är ju just det udda, lite oväntade. (SvD Kultur)

02 dash => comma

Och eftersom många byråer kräver ett maximalt engagemang - övertidsarbete är ofta obligatoriskt, bli r arbetet och barn en omöjli g kombination. / Och eftersom många byråer kräver ett maximalt engagemang, övertidsarbete är ofta obligatoriskt, bli r arbetet och barn en omöjli g kombination. (SvD Kultur)

04 colon => comma

Det kom en tjusig reklambroschyr i våra brevlådor: Från minus till plus. / Det kom en tjusig reklambroschyr i våra brevlådor, Från minus till plus. (UNT 970219 Debatt)

03 other sign => comma

Inte har Linus Larsson, 20, och Marco Romein, 21, kurskompisar på Teknisk fysik/ KTH, någon koll på reklamskolan Beckmans modevisningar. / Inte har Linus Larsson, 20, och Marco Romein, 21, kurskompisar på Teknisk fysik, KTH, någon koll på reklamskolan Beckmans modevisningar. (SvD Kultur)

Page 84: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 73 –

Other problems with commas (OP) Punctuation problems involving commas that do not fit in any of the other subcategories are delat with here.

01 comma(s) removed

... massproduktionen av T-fordens, dvs en teknik i behov av utveckling. /

... massproduktionen av T-fordens dvs en teknik i behov av utveckling. (UNT 970414 Debatt)

4.3.4 Dash within the Sentence (DW)

Problems with dashes within the sentence may be of two types. First, it can be used in the same way as a comma around inserted phrases or units. Second, the dash sign may be two short, that is a hyphen has been typed. The second problem belong to the graphical problems group.

Phrases / units (PH) The dash may fill t he same function as a comma at inserted phrases or units. When it comes to choice between the two marks, it is treated as a style problem belonging to the style, meaning, and reference group.

01 dash to be moved

Eftersom de problem man vill rätta till - trots ständigt ökade resurser ofta inte bli r mindre - ökas i stället insatserna på nytt och ett kostnadsdrivande arbetssätt tar allt ... / Eftersom de problem man vill rätta till - trots ständigt ökade resurser - ofta inte bli r mindre ökas i stället insatserna på nytt och ett kostnadsdrivande arbetssätt tar allt ... (UNT 970306 Debatt)

02 dash(es) to be inserted

... Judit Polgar en flicka dessutom! /

... Judit Polgar – en flicka dessutom! (UNT 970421 Schack)

03 dash to be removed

Två av de testade burkarna från NK-Hallen i Stockholm gick ut i december - 1996. / Två av de testade burkarna från NK-Hallen i Stockholm gick ut i december 1996. (SvD Inrikes)

Dash correct (DC) A dash may replace another sign. A problem with capital letter may be involved as well .

01 colon => dash [with capital letter problem]

Sommarnattens söta dofter, syrsornas gnissel, och där - innanför det strömförande snöret som bara anas i månskenet: Korna. / Sommarnattens söta dofter, syrsornas gnissel, och där - innanför det strömförande snöret som bara anas i månskenet - korna. (SvD Kultur)

02 semicolon => dash

Om alternativet till / .../ är en tydligt oberoende svensk riksbank, vars faktiska manöverutrym-me ändå starkt kommer att begränsas av den europeiska centralbankens beslut; varför är då ... / Om alternativet till / .../ är en tydligt oberoende svensk riksbank, vars faktiska manöverutrym-me ändå starkt kommer att begränsas av den europeiska centralbankens beslut - varför är då ... (UNT 970303 Ledare)

Page 85: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 74 –

03 comma => dash

Många ägs dessutom inte av storföretag utan av en eller ett fåtal personer som förmodligen - om man gräver lite i det, också i huvudsak består av män. / Många ägs dessutom inte av storföretag utan av en eller ett fåtal personer som förmodligen - om man gräver lite i det - också i huvudsak består av män. (SvD Kultur)

4.3.5 Colon (CN)

The colon category contains punctuation errors which are corrected by inserting a colon. Incorrect usage of colon is also addressed here when the colon is removed and not replaced by another sign. A problem with colons is related to the end of sentence punctuation problem: Does the colon mark a sentence boundary, and if so, what are the criteria for separating the uses or meanings from each other? The solution used in this typology involves looking at the following sentence: if it starts with a capital letter, the colon ends the previous sentence. Problems of this kind are dealt with in the category of end of sentence punctuation.

Colon correct (CC) When a colon is replacing another punctuation mark, the error falls within this subcategory. The specification states the erroneously used sign which the colon replaces.

01 semicolon => colon

Avdelningen börjar svagt; nog är det lätt att instämma i Jean Grimshaws kritik av vissa feministfilosofers drömmar om kvinnomoral; men i en volym som denna kan begäras att granskaren tar steget förbi det sagda till det rimligtvis avsedda. / Avdelningen börjar svagt: nog är det lätt att instämma i Jean Grimshaws kritik av vissa feministfilosofers drömmar om kvinnomoral; men i en volym som denna kan begäras att granskaren tar steget förbi det sagda till det rimligtvis avsedda. (CS4)

02 comma => colon

... har han sitt bestående minne, högra pekfingret klämdes sönder i en maskin. /

... har han sitt bestående minne: högra pekfingret klämdes sönder i en maskin. (UNT 970416 Uppland)

Colon missing (CM) A colon should be inserted where there is no punctuation mark. The specification is based on the function of the colon in the sentence.

01 before a citation, a quotation, etc

Om Gustav II Adolf påminner ännu i dag den relief som finns inristad i Nikolaidomkyrkans södra sida och med inskrift både på tyska och svenska ”Gustav Adolph/ü König von Schweden/Schirmherr des evangelischen Glaubens” , ”Sveriges konung/den evangeliska trons räddare”. / Om Gustav II Adolf påminner ännu i dag den relief som finns inristad i Nikolaidomkyrkans södra sida och med inskrift både på tyska och svenska: ”Gustav Adolph/ü König von Schweden/Schirmherr des evangelischen Glaubens” , ”Sveriges konung/den evangeliska trons räddare”. (UNT 961023 Likt och Olikt)

02 introducing an explanation, an example, etc

Med andra ord det finns inga genmanipulerade tomater. / Med andra ord: det finns inga genmanipulerade tomater. (UNT 970419 Inrikes)

Page 86: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 75 –

Incorrect usage of colon (IC) When colon is incorrectly used and should be removed, not replaced by another sign, the error belongs here.

01 before a citation within quotation marks

De ansvariga för rapporten: ”Ändrad ansvarsfördelning inom högskolesektorn” , den s k styr-gruppen med företrädare från Svenska akademiska rektorskonferensen, De nya högskolornas rektorskonvent samt VHS menar att det därför vore bättre om högskolorna själva tar över hela ansvaret för verksamheten. / De ansvariga för rapporten ”Ändrad ansvarsfördelning inom högskolesektorn” , den s k styr-gruppen med företrädare från Svenska akademiska rektorskonferensen, De nya högskolornas rektorskonvent samt VHS menar att det därför vore bättre om högskolorna själva tar över hela ansvaret för verksamheten. (GS28A)

02 other problems

... under senare år: mot ett mer auktoritärt styre ... /

... under senare år mot ett mer auktoritärt styre ... (UNT 970424 Ledare)

4.3.6 Semicolon (SN)

Semicolon is not perceived as a possible end of sentence mark. Otherwise, the classification guidelines are the same as for colon above.

Semicolon correct (CS) The use of colon has partly been taken care of by other categories. Here, the error of confusing colon and semicolon is addressed. The specification level states which sign the semicolon replaces.

01 colon => semicolon

... men den diskussionen är det helt omöjli gt att föra inom dagens urvattnade teologi och vi för den mycket riktgit på ett annat håll: i spekulativa kosmologier som Stephen Hawkins (som lig-ger nära men inte är riktig fysik) och i det fria diskursrum som science fiction-romanen erbjud-er och där Phili p K Dick försökte placera sin stormflodsartade gudsupplevelse från sextiotalets första år. / ... men den diskussionen är det helt omöjli gt att föra inom dagens urvattnade teologi och vi för den mycket riktgit på ett annat håll; i spekulativa kosmologier som Stephen Hawkins (som lig-ger nära men inte är riktig fysik) och i det fria diskursrum som science fiction-romanen erbjud-er och där Phili p K Dick försökte placera sin stormflodsartade gudsupplevelse från sextiotalets första år. (CS3)

02 comma => semicolon

Uppgiften var inte att komma fram till något svar på vad vi ska göra i en viss praktisk situa-tion, det svaret, hur angeläget det än må vara, var ingen vetenskaplig angelägenhet, och filoso-fen var vetenskapare. / Uppgiften var inte att komma fram till något svar på vad vi ska göra i en viss praktisk situa-tion; det svaret, hur angeläget det än må vara, var ingen vetenskaplig angelägenhet; och filoso-fen var vetenskapare. (CS4)

Semicolon missing (SM) A semicolon should be inserted where there is no punctuation mark.

Han håller inte med om att manifestet bör ha kommit som en blixt från klar himmel senaten och lantdagen var väl underkunniga om ... / Han håller inte med om att manifestet bör ha kommit som en blixt från klar himmel; senaten och lantdagen var väl underkunniga om ... (UNT 970219 Kultur)

Page 87: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 76 –

Incorrect usage of semicolon (IS) When semicolon is incorrectly used and should be removed, not replaced by another sign, the error belongs here. No specification is made.

I början av januari i år; ålades djurägaren att åtgärda brister på sammanlagt 13 punkter. / I början av januari i år ålades djurägaren att åtgärda brister på sammanlagt 13 punkter. (UNT 961023 Ettan)

4.3.7 Other Punctuation Problems (OP)

The main punctuation errors belong to one of the previous categories. If a certain problem keeps turning up, a separate category can be formed.

Erroneous punctuation in certain text types (EP) Certain text types follow specific norms when it comes to punctuation. For instance, a byline should not end with a point.

01 point to be removed in bylines, captions, headings, etc

Foto: Dick Pettersson. / Foto: Dick Pettersson (UNT 970416 Ettan)

02 other problems

Roland Johansson · TT / Roland Johansson/TT (UNT 970430 Uppsala)

Other erroneous punctuation marks (EM) Improper signs may sometimes occur.

01 after point

Jag har också fått chansen att gå steg 4-utbildning.™ / Jag har också fått chansen att gå steg 4-utbildning. / (UNT 961023 Sport)

02 erroneous slash

... betraktas som ärftliga, medicinska/alternativt neuropsykiatriska. /

... betraktas som ärftliga, medicinska alternativt neuropsykiatriska. (UNT 970219 Ledare)

Page 88: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 77 –

4.4 Graphical Problems (GR)

Graphical problems involve errors with graphical signs such as dashes, quotation marks, and parentheses. Furthermore, graphical problems include typographical errors. Not all subcategories have the error speci-fication level, since there is no need for that yet. The graphical problems categories are the following:

· Space (SC)

· New Line / Paragraph (NL)

· Dash before Direct Speech (DS)

· Dash within the Sentence (DW)

· Quotation Marks (QM)

· Parentheses (PA)

· Typographical Errors (TY)

· Other Graphical Problems (OP)

4.4.1 Space (SC)

Space is a single token. Problems with space and words are covered in the spelli ng errors group, while problems with space and punctuation marks are seen as graphical errors. Hyphens together with words are not seen as graphical signs, but together with figures, for instance in telephone numbers, hyphens are perceived as such. Problems involving space and hyphens are thus dealt with in the spelli ng errors group if only words are involved, and in the graphical problems group if only numbers are involved.

Missing space around signs (BA) Space tokens are missing on both sides of a sign and should be inserted. Missing space around hyphens are dealt with in the spelli ng error group.

01 dash within sentence (tankstreck)

Jag stiger rakt in i den blommande ginsten–och befinner mig vid Medelhavet. / Jag stiger rakt in i den blommande ginsten – och befinner mig vid Medelhavet. (SvD Stockholm)

02 three dots

... representanter för bolaget träffade...herr Kabila ... /

... representanter för bolaget träffade ... herr Kabila ... (UNT 970408 Världen)

Missing space before signs (SB) A space is missing before a sign, i.e. on its left side. The specification level states what signs are involved.

01 dash within sentence (tankstreck)

Holmger Knutsson– ett uppländskt helgon / Holmger Knutsson – ett uppländskt helgon (UNT 961022 Likt och Olikt)

02 three dots

Idag... / Idag ... (UNT 961022 Likt och Olikt)

Page 89: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 78 –

03 left parenthesis

Energibolaget Unified Energy System(UES) till hör de verkliga börsvinnarna med en uppgång från 8 till 36 cent(350 procent) och fortsatta goda prognoser. / Energibolaget Unified Energy System (UES) till hör de verkliga börsvinnarna med en uppgång från 8 till 36 cent (350 procent) och fortsatta goda prognoser. (SvD Näringsliv)

04 left quotation mark

de"missade möjli gheternas ... / de "missade möjli gheternas ... (UNT 970416 Ledare)

Missing space after signs (SM) Normally, a space token should appear after certain signs. The error specification is based on which that particular sign is.

01 comma

I konserten, som är den största någonsin i Göteborg,medverkar både Göteborgs Symfoniker och Göteborgsperans orkester, båda körerna och Kungl filharmoniska kören i Stockholm, en stor barnkör och åtta solister. / I konserten, som är den största någonsin i Göteborg, medverkar både Göteborgs Symfoniker och Göteborgsperans orkester, båda körerna och Kungl filharmoniska kören i Stockholm, en stor barnkör och åtta solister. (GS7A)

02 colon

Ålder:48 år / Ålder: 48 år (GS13A)

03 point

1989 sålde nämligen Göteborg sina skolfastigheter till dessa bolag.Universitetet kommer alltså att hyra Polhemsgymnasiet av SPP och AMF. / 1989 sålde nämligen Göteborg sina skolfastigheter till dessa bolag. Universitetet kommer alltså att hyra Polhemsgymnasiet av SPP och AMF. (GS27A)

09 exclamation mark

... än privatanställd!Det är ... /

... än privatanställd! Det är ... (UNT 970505 Läsarnas Forum)

04 dash before direct speech (pratminus)

–Det här bli r nog en spännande utmaning för arkitekterna, tror Hans Manneby, chef vid Bohusläns museum. / – Det här bli r nog en spännande utmaning för arkitekterna, tror Hans Manneby, chef vid Bo-husläns museum. (GS7ABC)

05 dash within sentence (tankstreck)

Sedan har medierna lyft fram den förhållandevis lugna stämningen och – enligt uppgift –”puf-fat på” försoningen. / Sedan har medierna lyft fram den förhållandevis lugna stämningen och – enligt uppgift – ”puf-fat på” försoningen. (GS6ABC)

Page 90: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 79 –

06 three dots

I dag kan hon bära tights, jeans, kort kjol ...tja, vad som helst. / I dag kan hon bära tights, jeans, kort kjol ... tja, vad som helst. (UNT 961022 Likt och Olikt)

07 right parenthesis

1)Kändis ertappas med rattfylleri och förstår först inte hur det har gått till , vill därefter prompt "ut i skolorna" för att berätta om hur det har gått till . / 1) Kändis ertappas med rattfylleri och förstår först inte hur det har gått till , vill därefter prompt "ut i skolorna" för att berätta om hur det har gått till . (SvD Inrikes)

10 right quotation mark

... schackspel."Exemplen är väl valda, ... /

... schackspel." Exemplen är väl valda, ... (UNT 970421 Schack)

08 other signs

Too littl e space (SL) The too littl e space subcategory is not about missing space, but when the space is too narrow.

01 between words in a row

02 indent missing (at new paragraph)

..., så lätt bli r ni inte av med oss. Låt oss konstatera följande om tanten, ... / ..., så lätt bli r ni inte av med oss. Låt oss konstatera följande om tanten, ... (UNT 961022 Likt och Olikt)

03 before heading

Too much space (ST) Too many space tokens directly after each other is an error to be corrected, as well as instances where a space token ought not to appear in connection with certain signs. Erroneous space in words are dealt with in the spelli ng errors group.

02 doubled space

Av de 132 barn som förlorat sina föräldrar är ett sjuttiotal helt föräldralösa. / Av de 132 barn som förlorat sina föräldrar är ett sjuttiotal helt föräldralösa. (GS7A)

06 too much indent

Samtidigt beklagar jag att väntetid uppstod och den olägenhet detta medfört för er. / Samtidigt beklagar jag att väntetid uppstod och den olägenhet detta medfört för er. (UNT 961022 Läsarnas Forum)

07 before point

– Janne har sagt upp sig på grund av familj skäl, vi har inte ens diskuterat om han skall vara kvar eller inte . / – Janne har sagt upp sig på grund av familj skäl, vi har inte ens diskuterat om han skall vara kvar eller inte. (UNT 961023 Sport)

Page 91: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 80 –

08 before comma

Hade det inte varit klokare att spara på kostsam ny teknik , låta bli att hyra svindyra lokaler? / Hade det inte varit klokare att spara på kostsam ny teknik, låta bli att hyra svindyra lokaler? (SvD Inrikes)

03 before right quotation mark

” --- Det är för oss det bästa betyg vi kan få. ” / ” --- Det är för oss det bästa betyg vi kan få.” (UNT 961022 Debatt)

01 after left bracket

Professor Judah Folkman presenterade resultaten för första gången vid laboratoriemötet vid NCI ( National Cancer Institute) i Bethesda i USA nyligen. / Professor Judah Folkman presenterade resultaten för första gången vid laboratoriemötet vid NCI (National Cancer Institute) i Bethesda i USA nyligen. (GS16A)

09 after left quotation mark

Ditte och Per Almqvist var ett av de föräldrapar som i SvD:s artikelserie " Barn till varje pris" berättade om nackdelarna med provrörsbefruktning. / Ditte och Per Almqvist var ett av de föräldrapar som i SvD:s artikelserie "Barn till varje pris" berättade om nackdelarna med provrörsbefruktning. (SvD Inrikes)

10 after slash

... med sin matte eller/ och husse. /

... med sin matte eller/och husse. (UNT 970421 Uppland)

04 before and/or after dash within the sentence (tankstreck) meaning till and the like

Det framgår att över 80 procent av unga människor i åldern 19 – 25 år inte ser några fördelar med en förtida avveckling. / Det framgår att över 80 procent av unga människor i åldern 19–25 år inte ser några fördelar med en förtida avveckling. (UNT 961022 Ledare)

05 before and/or after hyphen in telephone numbers and the like

018 - 17 01 47 / 018-17 01 47 (UNT 970428 Sport)

11 other erroneous space tokens

MR BILL i V5 -2 / MR BILL i V5-2 (UNT 970502 Sport)

4.4.2 New L ine / Paragraph (NL)

A new line token should not appear within a sentence, neither between a colon and the following citation. In addition, a line break should not appear within an abbreviation or in numbers.

Page 92: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 81 –

New line / paragraph to be removed (NR) A new line or paragraph token should be removed. The specification is based on where the erroneous token appears.

01 within a sentence

Men ändå, i perspektivet, kommer alla dessa förtvivlade att ha en grav att gå till . / Men ändå, i perspektivet, kommer alla dessa förtvivlade att ha en grav att gå till . (GS12A)

02 between colon and citation etc or the like

Inrikesministern sade: ”Vi måste kunna gripa de skyldiga och döma dem till adekvata straff .” / Inrikesministern sade: ”Vi måste kunna gripa de skyldiga och döma dem till adekvata straff .” (GS6ABC)

03 other

... själen går vidare ..

. /

... själen går vidare ... (UNT 970424 Kultur)

Erroneously placed line break (AB) An abbreviation can consist of several graphical words. These words (or characters) ought to stand on the same line; a ”hard space” ought to replace the ”soft” one to prevent an erroenous line break. The same goes for numbers with spaces. The result is that the line break is moved.

01 abbreviation

Varför sparkade t ex socaildemokraterna ut Skanska, ...? / Varför sparkade t ex socaildemokraterna ut Skanska, ...? (UNT 961022 Debatt)

02 number

... kommer att tävla på 1 500 meter. / ... kommer att tävla på 1 500 meter. (UNT 970416 Sverige)

03 other

... i Stockholm 4 juni. / ... i Stockholm 4 juni. (UNT 970423 Uppsala)

New line / paragraph to be inserted (NI) There are instances where a new line or paragraph should be inserted. No further specification is made.

Nr 2: Förenade Liv Användning: Kontor. / Nr 2: Förenade Liv. Användning: Kontor. (SvD Stockholm)

Page 93: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 82 –

4.4.3 Dash before Direct Speech (DS)

Direct speech is marked by a dash (pratminus), not by a hyphen. That is the most common error made within this category, but there are other problems as well .

Dash missing (DM) It might the case that direct speech is not marked, i.e. the dash is missing.

Jacka? Nej, jag saknar ingen, svarar han först. / – Jacka? Nej, jag saknar ingen, svarar han först. (GS29ABC)

Incorrect hyphen (IH) As mentioned above, a hyphen is often incorrectly used to mark direct speech. Sometimes, two hyphens should be replaced by a dash.

- Det är den allt för höga realräntan som hindrar bostadsbyggandet, säger Jörgen Andersson, och det försätter oss i något av en Moment 22-situation. / – Det är den allt för höga realräntan som hindrar bostadsbyggandet, säger Jörgen Andersson, och det försätter oss i något av en Moment 22-situation. (GS14ABC)

-- Vi hade en karaokemaskin och tidvis var det fler som var i det rummet än på dansgolvet. / – Vi hade en karaokemaskin och tidvis var det fler som var i det rummet än på dansgolvet. (UNT 970408 Uppland)

Incorrect dash (ID) If the following sentence is not direct speech, it should not be marked as such.

– För polisen är det ju bara att åka ut och hämta tjuven, resonerade Joakim. / För polisen är det ju bara att åka ut och hämta tjuven, resonerade Joakim. (GS29ABC)

Incorrect underscore (IU) Another sign that has been used instead of the correct dash is the underscore. This error has occurred together with missing space.

01 also missing space

_Ibland känns det orättvist, man kan ju ingenting göra, sa Magnus. / – Ibland känns det orättvist, man kan ju ingenting göra, sa Magnus. (SvD Sport)

02 space not missing

_ Kenneth Andersson var fantastisk i luften. / – Kenneth Andersson var fantastisk i luften. (UNT 970502 Sport)

4.4.4 Dash within the Sentence (DW)

Within sentences, dashes (tankstreck) can be used, for example to emphasize an inserted phrase. Not seldom, a hyphen or even an underscore is used instead. There are also cases in which the dash should be replaced by a hyphen. These errors belong in this category and form a separate subcategory. A dash is also used between words meaning ” to” (till ), for instance between numbers. The dash within the sentence category is closely related to both spelli ng errors (since no space is separating the words or numbers from each other when the dash is meaning till ) and punctuation problems (when the dash is used more or less as a comma around an inserted unit). The latter problems are dealt with in the punctuation problems group. Choosing between dash and comma is considered to be a style problem when both are correct. Typographical errors concerning the dash sign belong here in the graphical problems group.

Page 94: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 83 –

Incorrect hyphen (IH) A dash within the sentence can have several meanings, and the error specification tells which it is.

01 meaning till

Kostnaden beräknas till 50-70 milj oner, och första inflyttningen sker om ett år. / Kostnaden beräknas till 50–70 milj oner, och första inflyttningen sker om ett år. (GS27AB)

03 meaning mot

Gefle spelade 3-0 mot IFK Göteborg. / Gefle spelade 3–0 mot IFK Göteborg. (UNT)

02 at inserted units

Ombyggnaden medför en hyra på flera milj oner - kostnaden är ännu inte preciserad. / Ombyggnaden medför en hyra på flera milj oner – kostnaden är ännu inte preciserad. (GS27A)

Incorrect underscore (IU) The underscore token is used instead of a dash.

Vi skall i nte tjäna några pengar på det _ vi vill bara rädda så mycket vi kan. / Vi skall i nte tjäna några pengar på det – vi vill bara rädda så mycket vi kan. (GS9B)

Incorrect dash (ID) A dash is incorrectly used instead of another sign not represented with a category of its own.

01 dash => hyphen

0173 – 120 15 / 0173 - 120 15 (UNT)

4.4.5 Quotation Marks (QM)

Incorrectly used quotation marks are classified in this category unless the error involves end of sentence punctuation (an error belonging to a previous category).

Quotation within a quotation (WQ) When a quotation appears within a quotation, it should be surrounded by single quotation marks and not with double ones.

01 single quotations marks correct

”Cragg Hardaway, 16, uppgav i rätten att han var oskyldig till dödsskjutningen på Robert Sandifer, 11, som kallades ’’ Yummy’’ för att han tyckte om kakor och som var efterlyst för mordet på Shavon Dean, 14.” / ”Cragg Hardaway, 16, uppgav i rätten att han var oskyldig till dödsskjutningen på Robert Sandifer, 11, som kallades ’Yummy’ för att han tyckte om kakor och som var efterlyst för mordet på Shavon Dean, 14.” (GS26ABC)

Incorrect usage of single quotation marks (IS) Incorrect usage of single quotation marks occur when two single quotation marks have been written instead of one double quotation mark.

Page 95: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 84 –

01 double quotation marks correct

– Vi kan anställa fem milj oner poliser, men om vi inte kan tala om för våra barn vad som är rätt och fel kommer vi verkligen att hamna i svårigheter, fortsatte Clinton som talade om försmådda barn med ’’ hjärtan som hårdnat till sten’’ vid 10–11-årsåldern. / – Vi kan anställa fem milj oner poliser, men om vi inte kan tala om för våra barn vad som är rätt och fel kommer vi verkligen att hamna i svårigheter, fortsatte Clinton som talade om försmådda barn med ”hjärtan som hårdnat till sten” vid 10–11-årsåldern. (GS26A)

Quotation marks around titles, names etc (TI) Around titles, there could be either no quotation marks or double quotation marks.

01 no quotation marks correct

Nu har de köpt in sig i ungdomarnas värld via nöjesbranschen och skaffat sig myndighetsklingande namn som ”Drug Policy Foundation” och ”Criminal Justice Policy Foundation” . / Nu har de köpt in sig i ungdomarnas värld via nöjesbranschen och skaffat sig myndighetsklingande namn som Drug Policy Foundation och Criminal Justice Policy Foundation. (GS5A)

02 double quotation marks correct

Toaletten 'Dubbletten' har redan fått stor internationell uppmärksamhet, bl a på världskongres-sen i milj ö i Chicago i USA 1992 och på milj ösymposiet i Stockholm samma år. / Toaletten "Dubbletten" har redan fått stor internationell uppmärksamhet, bl a på världskongressen i milj ö i Chicago i USA 1992 och på milj ösymposiet i Stockholm samma år. (MS55)

Quotation marks around citations etc (CI) Quotation marks may be missing around a citation or the like. They could also have been put in erroneous places and should thus be moved.

01 both quotation marks missing

– Man säger till exempel att jag vill absolut inte störa när man ... / – Man säger till exempel att "jag vill absolut inte störa" när man ... (UNT 970415 Likt och Olikt)

02 left quotation mark missing

Faktiskt så omtyckt att vi är på väg att starta en egen tidning." / "Faktiskt så omtyckt att vi är på väg att starta en egen tidning." (SvD Kultur)

03 rigth quotation mark missing

... bildades 1972 för att /.../ samt "verka för bevarande av den uppländska naturen. /

... bildades 1972 för att /.../ samt "verka för bevarande av den uppländska naturen". (UNT 970405 Ettan)

04 quotations marks to be moved

"Galna hundsjukan kanske ärftlig" / "Galna hundsjukan" kanske ärftlig (UNT 970422 Världen)

Page 96: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 85 –

05 direct speech – quotation marks removed

– "Våldet är ständigt närvarande och man är rädd varje dag", sade många. / – Våldet är ständigt närvarande och man är rädd varje dag, sade många. (SvD Inrikes)

Quotation after ” så kallade” etc (SK) It is correct to use either the expression så kallade without quotation marks around the following saying, or without så kallade but with quotation marks around the saying. This goes for related expressions as well .

01 quotation marks to be removed

Men om häll ristningarna hamnar på Unescos så kallade ”världsarvslista” vid FN-organets möte i december får kraven på åtgärder ytterligare tyngd. / Men om häll ristningarna hamnar på Unescos så kallade världsarvslista vid FN-organets möte i december får kraven på åtgärder ytterligare tyngd. (GS9BC)

Other incorrect quotation marks (OP) Problems not covered by the subcategories above can be occassions where quotation marks do not appear in pairs.

01 not in pairs – quotation mark to be removed

När och i vilket sammanhang bli r en regim så ill egitim att förräderi är försvarbart?” frågar Gellerfelt. / När och i vilket sammanhang bli r en regim så ill egitim att förräderi är försvarbart? frågar Gellerfelt. (CS2)

02 incorrect graphical signs used for single quotation marks

"Sedan väntade jag på ́ the convenient day´... / "Sedan väntade jag på 'the convenient day'... (UNT 970505 Ettan)

4.4.6 Parentheses (PA)

Parentheses do normally appear in pairs. When they do not, the error belongs to this category. Another error occurs when the parentheses are to be removed. Parentheses may even be missing.

Parentheses not in pair (PP) When a parenthesis is missing, or is of a wrong type, the error fall i n this subcategory.

01 parenthesis of the same type

Mercators referat av ” Inventio” återger i vart fall mest en rad stolli gheter och en amsaga om ett härtåg av kung Arthur )!) upp mot nordpolen. / Mercators referat av ” Inventio” återger i vart fall mest en rad stolli gheter och en amsaga om ett härtåg av kung Arthur (!) upp mot nordpolen. (CS4)

Parentheses to be removed (PR) When parentheses are to be removed, the error belongs here.

01 both parentheses to be removed

I muthärvan som SvD rapporterade om ( ) åtalas den fd tjänstemannen för att ha tagit emot 1,2 milj oner kronor kontant, som betalning för att han systematiskt lagt 70 procent av Skärholm-ens socialdistrikts upphandling i ett och samma bolag. / I muthärvan som SvD rapporterade om åtalas den fd tjänstemannen för att ha tagit emot 1,2

Page 97: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 86 –

milj oner kronor kontant, som betalning för att han systematiskt lagt 70 procent av Skärholm-ens socialdistrikts upphandling i ett och samma bolag. (SvD Stockholm)

02 left parenthesis to be removed

(från tre ”fredliga” (kolångare) / (från tre ” fredliga” kolångare) (UNT 970410 Likt och Olikt)

Parentheses missing (PM) Parentheses that are missing should be inserted.

01 both parentheses missing

Nettovinsten efter full skatt blev 5,2 milj oner kronor 28,5 vilket motsvarar 1:50 per aktie (8:20) och en avkastning på eget kapital på 4 procent (16). / Nettovinsten efter full skatt blev 5,2 milj oner kronor (28,5) vilket motsvarar 1:50 per aktie (8:20) och en avkastning på eget kapital på 4 procent (16). (SvD Näringsliv)

03 left parenthesis missing

Då kan du ändå njuta av kaffet när du bestämt dig för att Inte Längre Röka). / (Då kan du ändå njuta av kaffet när du bestämt dig för att Inte Längre Röka). (UNT 970218 Debatt)

02 right parenthesis missing

HONGKONG (TT-AFP Den förra brittiska ... / HONGKONG (TT-AFP) Den förra brittiska ... (UNT 970428 Världen)

4.4.7 Typographical Err ors (TY)

Typographical errors covered within this particular category concern primarily the choice of fonts (italics, bold, font size, etc).

Lower case and upper case characters (GC) The beginning of a new section in the article might be typographically marked with upper case characters. When this has been done incorrectly, the error is specified in this subcategory. It could also be the other way around. These problems may also occur in bylines.

01 upper case => lower case

GELLERFELT FORTSÄTTER: ”Kommunismen har ju ...” / GELLERFELT fortsätter: ”Kommunismen har ju ...” (CS2)

02 lower case => upper case

1995 antogs en ny lag i Danmark. / 1995 ANTOGS en ny lag i Danmark. (UNT 970419 Uppland)

Italic (IT) Use of italic fonts may mark emphasis or a title of a book, a film, etc. Italics may also be used in captions.

Page 98: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 87 –

01 emphasis

Starkare att säga att ingen Gud, oavsett i vilken beskrivning vi tänker oss Honom, kan existera. / Starkare att säga att ingen Gud, oavsett i vilken beskrivning vi tänker oss Honom, kan existera. (CS3)

02 title

De senare diskuterar religionsfilosofen, docent Hans Nystedt i en på en gång kritisk, personlig och sympatiskt avspänd bok, Uppgörelse med Hedenius. Vad Ingemar Hedenius förstod och inte förstod av religion (Proprius 1992). / De senare diskuterar religionsfilosofen, docent Hans Nystedt i en på en gång kritisk, personlig och sympatiskt avspänd bok, Uppgörelse med Hedenius. Vad Ingemar Hedenius förstod och inte förstod av religion (Proprius 1992). (CS3)

03 in caption

Djurgårdaren Thomas Johansson /.../ med hjälp av handtecken. / Djurgårdaren Thomas Johansson /.../ med hjälp av handtecken. (UNT 970422 Uppland)

04 erroneous italic font

Foto: Christer Bergström / Foto: Christer Bergström (UNT 970423 Uppland)

Bold (BO) Bold fonts may fill different functions. The specificaitons state whether to insert or remove bold fonts.

01 bold missing

Fann guldsmycke. Arkeologen Lisa Rundqvist sökte med metalldetektor och fann ett häng-smycke av guld från 500-talet. / Fann guldsmycke. Arkeologen Lisa Rundqvist sökte med metalldetektor och fann ett häng-smycke av guld från 500-talet. (UNT 961023 Ettan)

02 bold to be removed

Thomas Tidholm: En broschyr om smär ta / Thomas Tidholm: En broschyr om smärta (UNT 970505 Kultur)

Font size (FS) The text may have been written in a font size too small or too large. No example is given

Other font problems (FO) Problems with fonts which can not be plaved in any of the previous subcategories belong here. No example is given.

Margins (MA) Problems with margins are considered in this subcategory. No example is given.

Page 99: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 88 –

4.4.8 Other Graphical Problems (OP)

Graphical problems that are not dealt with in any other category belong here. Erroneous hyphens not bound to any word form one subcategory.

Hyphens (HY) A hyphen standing alone that should be removed is a problem belonging here.

01 hyphen to be removed

vård - och omsorg / vård och omsorg (UNT 970417 Uppland)

Accent (AC) An accent standing alone that should be removed is a problem belonging here.

Komora lade skulden på Kabbah, landets förste demokratiskt valde president, som enligt kuppledaren uppmuntrat ´stamtänkande./ Komora lade skulden på Kabbah, landets förste demokratiskt valde president, som enligt kuppledaren uppmuntrat stamtänkande. (SvD Utrikes)

Apostroph (AP) An apostroph is misplaced before or after a word (not in the genitive), and should be removed. It could also be the case that the graphical sign used is an erroneous one.

'Men jämfört med Creedencelåtarna bli r det tamt. / Men jämfört med Creedencelåtarna bli r det tamt. (SvD Kultur)

fan tro´t / fan tro't (UNT 970218 Debatt)

Other signs (OS) Problems with other signs belong here. No specification is made.

… vi har >>>missat … / … vi har missat … (UNT 970424 Uppland)

Page 100: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 89 –

4.5 Style, Meaning, and Reference (SP)

Style problems are about choice between correct alternatives. If the proof-reader has changed a correct sentence, the problem is a stylistic one. The decision whether the original sentence is correct, is made by the person classifying the errors, not the proof-reader or the current norm at the newspaper in question. The goal is to make the typology as independent as possible of the newspapers and rely more on a common language norm expressed in dictionaries (such as Svensk ordbok and Nationalencyklopedins ordbok) and in guidelines (such as Svenska skrivregler). Problems with capital letters in names etc are however never treated as style problems, even if the original spelli ng may be perceived as correct. Stylistic and semantic issues are very often interrelated, and therefore no specific group for semantic problems has been constructed – they are all gathered in the style, meaning, and reference group together with problems ranging over sentence boundaries. The style, meaning, and reference group contains the following categories:

· Preferred Spelli ng (PS)

· Abbreviation (AB)

· Number Style (NS)

· Correct Word Category but Wrong Word (WN)

· Choice of Words and Expressions (CW)

· Choice of Signs (CS)

· Choice of Sentence Boundaries (CB)

· Choice of Syntactic Construction (SC)

· Consistency (CN)

· Redundancy (RD)

· Referential Problems (RP)

4.5.1 Preferred Spelli ng (PS)

The preferred spelli ng category has not been further subdivided, mostly because no obvious basis for subcategorisation is at hand. The error type code for all preferred spelling problems is thus SPPSPS01. Note that preferred spelli ng of abbreviations belongs to the next category.

Vi kan inte låta våra barn växa upp här, om vår son ska bli uthängd som mördare, säger kvinnan. / Vi kan inte låta våra barn växa upp här, om vår son skall bli uthängd som mördare, säger kvinnan. (GS19ABC)

4.5.2 Abbreviation (AB)

Depending on the type of the abbreviation error, it is classified as belonging to different error groups. When the proof-reader has replaced one correct form with another correct form, the error is a stylistic one. A more semantic type of error occurs when an abbreviation used in an article lacks explanation.

Choice of abbreviated form (CA) Some expressions can be abbreviated in different ways (cf. the preferred spell ing category).

Dessa ligger sedan som grund till ämnesbetygen som ges på vanligt sätt, dvs från åttan. / Dessa ligger sedan som grund till ämnesbetygen som ges på vanligt sätt, d v s från åttan. (GS25ABC)

Page 101: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 90 –

Full expression preferred (FE) Sometimes the full expression is preferred over the abbreviated form.

Förutom att betala till baka rånbytet döms ligamedlemmarna att betala skadestånd, sammanlagt ca 13,5 milj oner kronor. / Förutom att betala till baka rånbytet döms ligamedlemmarna att betala skadestånd, sammanlagt cirka 13,5 milj oner kronor. (GS23C)

4.5.3 Number Style (NS)

Number style errors involve problems with choosing the proper numerical expressions. The specifications are based on different types of number expression but also on its position in the sentence. If the change is made out of consistency reasons, the problem belongs to the consistency category.

Number beginning the sentence (BS) When the sentence begins with a number, the number ought to be written out in letters.

28 svenskar har kommit hem. / Tjugoåtta svenskar har kommit hem. (GS12ABC)

Small numbers (SN) Numbers up to twelve are usually written with letters. There are however occassions where even small numbers ought to be expressed in figures. For instance, figures can be used to be make the number more exact. The small number subcategory includes problems involving fractions.

01 figures => letters

Valands konsthögskola flyttar från Hisingen till centrala Göteborg, och samtidigt startar en för landet ny ettårig konstutbildning på 40 poäng vid sidan om den 5-åriga utbildningen. / Valands konsthögskola flyttar från Hisingen till centrala Göteborg, och samtidigt startar en för landet ny ettårig konstutbildning på 40 poäng vid sidan om den femåriga utbildningen. (GS27A)

02 letters => figures

Endast fem procent av offren var vita. / Endast 5 procent av offren var vita. (UNT 970409 För Dagen)

Decimal numbers (DN) Decimal numbers are normally expressed by using a comma. For prices and costs, however, a colon might also be correct. The specification level states what the decimal number denotes: whether it is a measure or a price.

01 measure

39.82 i diskus / 39,82 i diskus (UNT 970415 Sporten)

02 price, cost, etc

... till ett pris av 8.30 kr per liter går 6.22 kr till skatt. /

... till ett pris av 8:30 kr per li ter går 6:22 kr till skatt. (UNT 970429 Läsarnas Forum)

03 time measure

… 6,30 minuter efter. / … 6.30 minuter efter. (UNT 970502 Sport)

Page 102: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 91 –

04 space(s) to be removed at the comma

1 , 5 milj arder kronor / 1,5 milj arder kronor (UNT 970416 Ledare)

Large numbers (LN) Large numbers do usually have a space token inserted for every third figure from the right. This rule should of course not be followed for years.

01 space missing in large numbers

Förr arbetade han ute på fältet (1300 arresteringar) men nu reser han runt i skolorna och berättar. / Förr arbetade han ute på fältet (1 300 arresteringar) men nu reser han runt i skolorna och berättar. (GS5A)

02 dot => space

De 7.263 åskådarna kan nu definitivt räkna med att det bli r kvalspel för Umeå. / De 7 263 åskådarna kan nu definitivt räkna med att det bli r kvalspel för Umeå. (UNT 961022 Sport)

03 other problems

6,997 milj oner kronor / 6 997 000 kronor (UNT 970410 Uppland)

Approximate figures (AF) Approximate figures may be expressed in various ways. Expressions only stated in words are not considered here. No specifications are made, but two examples are given.

Sammanlagt ett 30-tal olika projekt pågår kring till växthormon och till växtfaktorer som kan användas inom vuxenmedicin / Sammanlagt omkring 30 olika forskningsprojekt pågår kring till växthormon, som kan användas inom vuxenmedicinen. (GS8A)

telefonräkningar på 3–4 000 kronor / telefonräkningar på 3 000–4 000 kronor (UNT 970219 Uppsala)

Ordinals (OR) Ordinals can be also be expressed in figures or in letters.

De 132 estniska barn som förlorat någon förälder eller båda i Estoniakatastrofen kommer att få ekonomisk hjälp tack vare den mäktiga manifestation som Göteborgsoperan genomför den 25 och 27 november då man uppför Mahlers 8:e symfoni. / De 132 estniska barn som förlorat någon förälder eller båda i Estoniakatastrofen kommer att få ekonomisk hjälp tack vare den mäktiga manifestation som Göteborgsoperan genomför den 25 och 27 november då man uppför Mahlers åttonde symfoni. (GS7A)

Year, date, time etc (YD) When a sentence begins with a year, the year is not spelled out but the word år is put first. Other problems concern expressing years with two or four figures, and when the date should be spelled out or not. Concerning the use of the definite article den before dates, the use is optional and therefore considered here in the style, meaning, and reference group instead of in the grammar problems group.

Page 103: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 92 –

01 year beginning the sentence

1989 sålde nämligen Göteborg sina skolfastigheter till dessa bolag. / År 1989 sålde nämligen Göteborg sina skolfastigheter till dessa bolag. (27ABC)

08 incorrect space in years

... och därmed aktualiseras också mysteriet med dess spårlösa försvinnande efter 500 års existens, strax före eller nära samtidigt med ”De stora upptäckterna” fram mot 1 500. / .. och därmed aktualiseras också mysteriet med dess spårlösa försvinnande efter 500 års existens, strax före eller nära samtidigt med ”De stora upptäckterna” fram mot 1500. (CS5)

09 problems with space in dates

(se t ex UNT 15/5-95) (se t ex UNT 15/5 -95) (UNT 970421 Debatt)

02 definite article missing in date

Och detta kan innebära att VHS, med start från första juli 1995, omvandlas till en mer renodlad serviceorganisation. / Och detta kan innebära att VHS, med start från den första juli 1995, omvandlas till en mer renodlad serviceorganisation. (GS28AB)

03 definite article to be removed in date

I samband med beslutet den 4 december 1993 ställde länsstyrelsen nio preciserade krav för dragningen förbi Gamla Uppsala, bland annat att vägen ska grävas ned två–fem meter och att den flyttas 50 meter österut i vägkorridoren. / I samband med beslutet 4 december 1993 ställde länsstyrelsen nio preciserade krav för dragningen förbi Gamla Uppsala, bland annat att vägen ska grävas ned två–fem meter och att den flyttas 50 meter österut i vägkorridoren. (UNT 961025 Uppsala)

04 definite form => indefinite form in day

... till ett möte i samhällets Folkets hus fredagen 30 maj. /

... till ett möte i samhällets Folkets hus fredag 30 maj. (UNT 970419 Uppland)

05 alternative date expression

24/4 har aktiebolaget styrelsemöte. / Den 24 april har aktiebolaget styrelsemöte. (UNT 970421 Debatt)

06 alternative time expression

... i kväll l ördag kl 19.00. /

... i kväll l ördag kl 19. (UNT 970419 Uppland)

07 alternative year expression

... hade urpremiär i Göteborg -95 ... /

... hade urpremiär i Göteborg 1995 ... (UNT 970409 För Dagen)

Page 104: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 93 –

Other problems (OP) Other problems with number style not addressed in the previous subcategories may involve telephone numbers.

01 missing space(s) in telephone number

018-170163 / 018-17 01 63 (UNT 970422 Uppsala)

02 space misplaced in telephone number

018-170 122 / 018-17 01 22 (UNT 970422 Uppsala)

03 space to be removed

... som talade över Joh 20:1 1. /

... som talade över Joh 20:11. (UNT 970410 Familj enytt)

4.5.4 Correct Word Category but Wrong Word (WN)

To differ between words in the same word category, more semantic information is needed both about the separate wors and the whole context. A further error specification than the word categories, for instance based on semantics, has not been made.

Adjectives (AV)

... är varje anställd en hög investering. /

... är varje anställd en stor investering. (UNT 970417 Ledare)

Adverbs (AB)

Trots ett antal möten har Svenska kraftnäts och Vattenfalls representanter fortfarande inte lyckats besvara frågorna på ett övertygande sätt, vare sig om milj öeffekterna eller vilken samhällsnytta elkabeln gör. / Trots ett antal möten har Svenska kraftnäts och Vattenfalls representanter ännu inte lyckats besvara frågorna på ett övertygande sätt, vare sig om milj öeffekterna eller vilken samhällsnytta elkabeln gör. (SvD Inrikes)

Conjunctions and Conjunctional Adverbs (CN)

Budgetpropositionens 6,5 milj oner kronor till Tierps kommun kommer som på beställning när vård- och omsorgsnämnden så sent som i slutet på förra veckan redovisade ett underskott på 14,5 milj oner kronor. / Budgetpropositionens 6,5 milj oner kronor till Tierps kommun kommer som på beställning eftersom vård- och omsorgsnämnden så sent som i slutet på förra veckan redovisade ett under-skott på 14,5 milj oner kronor. (UNT 970416 Uppland)

... det är en myt att ungdomar skulle vara mer mogna nu, vare sig socialt eller fysiskt. /

... det är en myt att ungdomar skulle vara mer mogna nu, varken socialt eller fysiskt. (UNT 970306 Ledare)

Nouns (NN)

De förstår inte konsekvenserna av vad de har gjort, säger Silj es mot, Beathe Redergård, som på måndagen besökte ett av föräldraparen till en av de inblandade pojkarna. /

Page 105: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 94 –

De förstår inte konsekvenserna av vad de har gjort, säger Silj es mor, Beathe Redergård, som på måndagen besökte ett av föräldraparen till en av de inblandade pojkarna. (GS19A)

Prepositions (PR)

Till skill nad mot tidigare får hon nu ha hela sitt kunskapsstoff aktuellt samtidigt. / Till skill nad från tidigare får hon nu ha hela sitt kunskapsstoff aktuellt samtidigt. (GS25AB)

Pronouns (PN)

Frågeställningen om hur man bör analysera ett sjukhus och dess verksamhet ekonomiskt, som är orsaken till att vi träffas, intresserar honom mycket. / Frågeställningen om hur man bör analysera ett sjukhus och dess verksamhet ekonomiskt, vil -ken är orsaken till att vi träffas, intresserar honom mycket. (SvD Stockholm)

Verbs (VB) The verb category contains phrasal verbs as well as well as ordinary verbs.

Det kan se antingen genom att huvudtumören själv producerar skyddande substanser eller via aktivering av andra ämnen i blodet. / Det kan ske antingen genom att huvudtumören själv producerar skyddande substanser eller via aktivering av andra ämnen i blodet. (GS16AB)

Ingrid håller i pastoratets ekonomi / Ingrid sköter pastoratets ekonomi (UNT 970419 Uppsala, rubrik)

Interjections (IN)

Jo, det tycker jag också, ... / Ja, det tycker jag också, ... (UNT 970429 Debatt)

4.5.5 Choice of Words and Expressions (CW)

Choice of words and expressions involves different kinds of linguistic and non-linguistic information that is diff icult to formalise. No further subcategorisation has therefore been made. All problems that can not be classified in any other category in any other group fall within this category. (No correct version of the example was available in the material.) All errors in this category are given the error type code SPCWCW00.

Även i Helsingfors körs de svenska offren i procession innan de förs till Åbo och fraktas över till Silj aterminlaen i Stockholm. (GS3)

4.5.6 Choice of Signs (CS)

Dash and comma are at some occassions interchangable, as are dash and colon.

Dash => Colon (CD)

Vi måste fråga oss – har det funnits hål i skrovet som vi ej varit medvetna om? / Vi måste fråga oss: har det funnits hål i skrovet som vi ej varit medvetna om? (GS15AC)

Page 106: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 95 –

Colon => Dash(es) (DS) A colon is replaced by a dash. In some cases, another dash is inserted as well .

De elever som SvD träffar i korridoren efter den gemensamma mattekursen i snabbtakt: Julius Tibbelin Peter Jönsson, Åsa Berndtsson och Therese Kjellman framför också en hel del nega-tiva synpunkter: / De elever som SvD träffar i korridoren efter den gemensamma mattekursen i snabbtakt – Julius Tibbelin Peter Jönsson, Åsa Berndtsson och Therese Kjellman – framför också en hel del negativa synpunkter: (GS25A)

Dash => Slash (SL) A dash is sometimes replaced by a slash.

Uppsala-Stockholmsregionen / Uppsala/Stockholmsregionen (UNT 970304 Ledare)

Points in li sts (PE) When making a list with numbers, the sign after the number may be changed.

1) Mario Lemieux / 1. Mario Lemieux (UNT 970415 Sporten)

4.5.7 Choice of Sentence Boundar ies (CB)

The category of choice of sentence boundaries contains problems with sentence boundaries. Some sentences are divided into several sentences. Other sentences are joined together in one sentence. The subcategorisation states how the sentences have been changed.

One sentence => Two sentences (OT)

Jag tror att den konstellation av EU-parlamentariker vi nu sänder till Strasbourg och Bryssel inte kommer att kunna spela en positiv roll i denna process, tvärtom. / Jag tror att den konstellation av EU-parlamentariker vi nu sänder till Strasbourg och Bryssel inte kommer att kunna spela en positiv roll i denna process. Tvärtom. (CS1)

Two sentences => One sentence (TO)

... att lyssna och till mäta alla kommunens politi ker likvärdighet. Att därefter fatta politi ska beslut som tar samma hänsyn till alla kommunens invånare. / ... att lyssna och till mäta alla kommunens politi ker likvärdighet och att därefter fatta politi ska beslut som tar samma hänsyn till alla kommunens invånare. (UNT 970412 Ledare)

4.5.8 Choice of Syntactic Construction (SC)

Syntactic constructions are also a matter of choice. So far, three types of issues are addressed: omission of auxili ary ha, omission of relative pronoun, and the adverb så as a doubled constituent.

Omitted auxili ary ” ha” (OM) The auxili ary verb ha might be omitted without making the sentence syntactically incorrect. The specifications are based on the context in which the omitted ha should be inserted. Specification 01 deals with improperly omitted ha in perfect infinitives, i.e. the infinitive ha + the supine.

01 missing ha in the perfect infinitive

Om inte detta hänt, bedömer vi att Estonia skulle klarat sig trots att hon var utan visir./ Om inte detta hänt, bedömer vi att Estonia skulle ha klarat sig trots att hon var utan visir. (GS15ABC)

Page 107: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 96 –

When forming the perfect and the past perfect tenses, the finite temporal auxili ary verbs har and hade, respectively, may be omitted in subordinate clauses. In main clauses, however, it is not grammatically correct to leave out the auxili ary verb.

02 missing auxili ary har/hade in subordinate clause

Det är inte bara hans eget liv som förändrats ... / Det är inte bara hans eget liv som har förändrats .../ (UNT 970422 Uppsala)

Omission of relative pronoun (OR) The relative pronoun, often som, may be omitted if the relative clause is a necessary one, and if it has a subject of its own so that the relative pronoun would function as the object of the relative clause.

01 som to be removed

Det är dem som man lyssnar på … när man är liten. / Det är dem man lyssnar på … när man är liten. (UNT)

The adverb ” så” (SR) The adverb så is often used as an unstressed doubled constituent that could be removed without making the sentence incorrect.

Men under dagen så började små … / Men under dagen började små … (UNT 970430 Uppsala)

4.5.9 Consistency (CN)

Consistency is violated when the same word or type of expression is written in two correct but different ways within the same text. The specification level deals with the types of expressions involved. All examples do not have a correct version of the sentences, since they were not given in the material.

Number (NB)

Läkare bör lyssna på patienternas uppfattning om orsaken till symtomen och ta del av patien-tens oro. / Läkare bör lyssna på patientens uppfattning om orsaken till symtomen och ta del av patientens oro. (UNT 961023 Läsarnas Forum)

Spelli ng / Word form (SP)

Initiativet till samma modell på högstadienivå stod den förre skoldirektören i Västerås Lars Höglind samt Skilj eboskolans förra rektor Gert Alsenmyr för. (GS25ABC)

Number style (NS)

I de två Lerumsbesättningarnas arbetstid ingår arbete från 07 till 17.30 därefter så kallad beredskapstid fram till 07. (GS1A)

4.5.10 Redundancy (RD)

When redundant information is removed from a sentence, the problem belongs in the redundant category. Subcategorisation or specification is made. All redundancy problems are given the error type code SpRDRD00.

Denna kärltill växt, som kallas angiogenes, är nödvändig för att tumörer skall kunna utvecklas och växa i storlek. /

Page 108: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 97 –

Denna kärltill växt är nödvändig för att tumörer skall kunna utvecklas och växa. (GS16A)

4.5.11 Referential Problems (RP)

Referential problems that span over sentence boundaries are dealt with here, while referential problems within a sentence are considered in the grammar problems group. A division between different types of reference is made. One line is drawn between specific and general reference. Specific reference is made to something in particular, while general reference is made to something in general. Another type of reference occurs between textual entities, such as a noun phrase and a pronoun.

NP and NP (NP) No division between anaphoric and deictic reference is made here as in the grammar problems group. The specification level is based on the problematic grammatical features. One specification deals with replacing a noun with a pronoun.

01 grammatical gender

... socialnämndens stora budgetöverdrag. Kanske beror den på att vikarier inom äldreomsorgen

... /

... socialnämndens stora budgetöverdrag. Kanske beror det på att vikarier inom äldreomsorgen

... (UNT 970415 Ledare)

03 semantic gender vs grammatical gender

... UASS-veteranerna Thomas Marttala och /.../ Den förstnämnda ... /

... UASS-veteranerna Thomas Marttala och /.../ Den förstnämnde ... (UNT 970306 Uppsala)

02 number

Årets första uppländska tussilago har inrapporerats från Stenhagen i Uppsala. De hittades av ... / Årets första uppländska tussilago har inrapporerats från Stenhagen i Uppsala. Den hittades av ... (UNT 970304 Ettan)

04 noun => pronoun

... hjärtat har hela tiden slagit väldigt disciplinerat och trevligt. Det räknar jag med att hjärtat skall fortsätta att göra ... / ... hjärtat har hela tiden slagit väldigt disciplinerat och trevligt. Det räknar jag med att det skall fortsätta att göra ... (UNT 970422 Uppsala)

NP and AP (NA) Agreement problems might cross sentece boundaries, and is then treated as referential problems.

01 gender

Turbo är en ny sortgrupp /.../ Den finns i ett mycket stort antal färger /.../ Vitt med rosa öga ... / Turbo är en ny sortgrupp /.../ Den finns i ett mycket stort antal färger /.../ Vit med rosa öga ... (UNT 970411 Sverige)

Clause and pronoun (CR) The relative pronoun may refer to a whole clause. Erroneous choice of such a pronoun is a problem belonging to this subcategory.

Page 109: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 98 –

Det amerikanska frihetskriget under slutet av 1700-talet beskrivs ofta som den lokala befolk-ningens enade uppror mot den brittiska kolonialmakten. Vilken är en sanning med modifika-tion. / Det amerikanska frihetskriget under slutet av 1700-talet beskrivs ofta som den lokala befolk-ningens enade uppror mot den brittiska kolonialmakten. Vilket är en sanning med modifika-tion. (UNT 961022 Likt och Olikt)

General and specific reference (GS) A general reference may be changed into a specific reference, and vice versa. The latter case has not yet occurred in the material.

01 general => specific

Budgetpropositionens 6,5 milj oner kronor till Tierps kommun kommer som på beställning eftersom vård- och omsorgsnämnden så sent som i slutet på förra veckan redovisade ett underskott på 14,5 milj oner kronor. – Visst kommer pengar väl till pass, konstaterar ... / Budgetpropositionens 6,5 milj oner kronor till Tierps kommun kommer som på beställning eftersom vård- och omsorgsnämnden så sent som i slutet på förra veckan redovisade ett underskott på 14,5 milj oner kronor. – Visst kommer pengarna väl till pass, konstaterar ... (UNT 970416 Uppland)

Page 110: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 99 –

5 Closing Remarks

Errors in newspapers may be of many different types. To capture this variety, the typology needs to be quite elaborate. In response to suggestions made by the partners, an attempt was made to describe the ty-pology in a flowchart. It was, however, found inappropriate as a pedagogic tool. As an alternative, an interface to the Error Corpora Database was created to make it easier for the user to navigate in the typology.

An error typology built on factual errors occurring in newspapers will perhaps never be complete. During application and revision the typology was found to be adequate for describing Swedish errors. So far, approximately 9000 error instances have been pro-cessed. Continued work with the Error Corpora Database will show how well the typo-logy conforms to Danish and Norwegian. The typology is open to modifications. In specific, new types can readily be added at the lower levels of the typology. If there is a need for a less detailed typology, only the higher levels may be used.

Page 111: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 100 –


Hultman, Tor (1987): Objekt som objekt. In: Teleman, Ulf (red): Grammatik på vill ovägar. Arlöv. Jörgensen, Nils & Svensson, Jan (1986): Nusvensk grammatik. Malmö. Lindberg, Ebba (1980): Beskrivande svensk grammatik. Stockholm. Ljung, Magnus & Ohlander, Sölve (1982). Allmän grammatik. Stockholm. Malmgren, Sven-Göran (1994): Svensk lexikologi. Ord, ordbildning och orddatabaser. Lund. Nationalencyklopedins ordbok (1995–1996). Sandström, Gabriella (1994): Från manus till t ryck – en undersökning av korrekturfel i Svenska

Dagbladets inrikesartiklar. Examensarbete, Språkkonsultli njen, Institutionen för nordiska språk, Stockholms universitet.

Skrivregler för Svenska Dagbladet (1987), Stockholm. Svensk ordbok (1986). Svenska Akademiens ordlista (1986). Svenska språknämnden (1991): Svenska skrivregler. Uppsala. Teleman, Ulf (1974): Manual för grammatisk beskrivning av talad och skriven svenska. Lund. Teleman, Ulf (1987): Hur många genus finns det i svenskan? In: Teleman, Ulf (red): Grammatik på

vill ovägar. Arlöv. Thorell , Olof (1973): Svensk grammatik. Stockholm. Wedbjer Rambell , Olga et al (1998): An Error Database of Swedish. SCARRIE, Deliverable,

version 1.0. Widmark, Gun (1992): Kongruensförändring i språkvärderingsperspektiv. In: Widmark, Gun (red):

Svenska i harmoni. Fyra uppsatser om kongruens. Ord och stil 25. Uppsala.

Page 112: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 101 –

Appendix A:

Uppsala universitet Institutionen för lingvistik 97-09-17/BD

ECD - ERROR CORPORA DATABASE - SPECIFICATION The ECD, error corpora database, is constructed for the purpose of storing and making searchable instances of textual errors and their corrections together with information of their origin and classification type. The primary table in the database is Table 1, holding the sentences with uncorrected and corrected errors. The logical organisation of Table 1 is as listed below. TABLE 1 SEQ NO numerical value, 1,2...n [internal usage only] ORG ID alphanumerical code, 4 chars, organisation USER ID alphanumerical code, 4 chars, paper or publishing house PUBL DATE alphanumerical code, 8 chars, date of publication TEXT SECTION alphanumerical code, 14 chars, text category (e.g. culture,

politi cs) TEXT TYPE alphanumerical code, 11 chars, text type (e.g. headline, plain

text) ERROR TYPE CODE alphanumerical code, 8 chars (fixed pos for cat and sub cat) ERROR TOKEN full sentence or sentence fragment (max 400 chars) CORRECTED TOKEN full sentence or sentence fragment (max 400 chars) COMMENT free text (max 400 chars) Example of Table 1 entry: ORG ID UU USER ID SVD PUBL DATE 19950214 TEXT SECTION KULTUR TEXT TYPE TEXT ERROR TYPE CODE GPNPNN01 ERROR TOKEN Även om Alfred Nobel bara bodde här i två är det så oerhört

mycket som påminner om hans innehållsrika liv från födseln 1833 till bortgången 1896, säger Tina Svanberg-Lundgren.

CORRECTED TOKEN Även om Alfred Nobel bara bodde här i två år är det så oerhört mycket som påminner om hans innehållsrika liv från födseln 1833 till bortgången 1896, säger Tina Svanberg-Lundgren.


Page 113: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 102 –

INPUT DATA To manually insert data, case for case, into the ECD database, is both time consuming and ineff icient. Therefore we propose that data to be inserted into ECD should be delivered in batch, as a text file with all the error data given in a standardised form. Such a batch file will t hen be used by an automatic procedure that will i nsert all the cases into the ECD database. The data for Table 1 should be delivered as a text document in ASCII , where each error entry consists of four or five fields, each starting with a numeral in column one, identifying the field. Field no Contents 1 Error token (can be several l ines) 2 Corrected token (can be several li nes) 3 Error type code 4 Origin: org, user, publ date, text section and text type (separated by slashes) 5 Comment (optional) and a blank line as a separator… The ECD entry given as example above should then in the data input batch file be given as below: 1 Även om Alfred Nobel bara bodde här i två är det så oerhört mycket som påminner om 1 hans innehållsrika liv från födseln 1833 till bortgången 1896, säger Tina 1 Svanberg-Lundgren. 2 Även om Alfred Nobel bara bodde här i två år är det så oerhört mycket som påminner om 2 hans innehållsrika liv från födseln 1833 till bortgången 1896, säger Tina 2 Svanberg-Lundgren. 3 GPNPNN01 4 UU/SvD/19950214/KULTUR/TEXT 5 kommentar MORE TABLES Table 2 holds info in plain text about the individual error type codes used in table 1. Its purpose is purely informational, and the table has the format given below. TABLE 2 ERROR TYPE CODE alphanumerical code (max 8 chars) ERROR DESCRIPTION free text (max 120 chars)

Page 114: Error Typology for Automatic Proof-reading Purposes4.2.10 Referential Problems (RP) _____59

– 1 –

Bibliography and References

Hultman, Tor (1987): Objekt som objekt. In: Teleman, Ulf (red): Grammatik på vill ovägar. Arlöv. Jörgensen, Nils & Svensson, Jan (1986): Nusvensk grammatik. Malmö. Lindberg, Ebba (1980): Beskrivande svensk grammatik. Stockholm. Ljung, Magnus & Ohlander, Sölve (1982). Allmän grammatik. Stockholm. Malmgren, Sven-Göran (1994): Svensk lexikologi. Ord, ordbildning och orddatabaser. Lund. Nationalencyklopedins ordbok (1995–1996). Sandström, Gabriella (1994): Från manus till t ryck – en undersökning av korrekturfel i Svenska

Dagbladets inrikesartiklar. Examensarbete, Språkkonsultli njen, Institutionen för nordiska språk, Stockholms universitet.

Skrivregler för Svenska Dagbladet (1987). Stockholm. Svensk ordbok (1986). Svenska Akademiens ordlista (1986). Svenska språknämnden (1991): Svenska skrivregler. Uppsala. Teleman, Ulf (1974): Manual för grammatisk beskrivning av talad och skriven svenska. Lund. Teleman, Ulf (1987): Hur många genus finns det i svenskan? In: Teleman, Ulf (red): Grammatik på

vill ovägar. Arlöv. Thorell , Olof (1973): Svensk grammatik. Stockholm. Wedbjer Rambell et al (1998): An Error Database of Swedish. SCARRIE, Deliverable, version

1.0. Widmark, Gun (1992): Kongruensförändring i språkvärderingsperspektiv. In: Widmark, Gun (red):

Svenska i harmoni. Fyra uppsatser om kongruens. Ord och stil 25. Uppsala.