Validating an integrated reading-into-writing scale with trained university students

Claudia Harsch; Valeriia Koval; Paraskevi (Voula) Kanistra; Ximena Delgado-Osorio

doi:10.1016/j.asw.2024.100894

Assessing Writing Oct 2024 Open Access

Validating an integrated reading-into-writing scale with trained university students

Claudia Harsch University of Bremen ; Valeriia Koval University of Bremen ; Paraskevi (Voula) Kanistra ; Ximena Delgado-Osorio DIPF | Leibniz Institute for Research and Information in Education

Abstract

Integrated tasks are often used in higher education (HE) for diagnostic purposes, with increasing popularity in lingua franca contexts, such as German HE, where English-medium courses are gaining ground. In this context, we report the validation of a new rating scale for assessing reading-into-writing tasks. To examine scoring validity, we employed Weir’s (2005) socio-cognitive framework in an explanatory mixed-methods design. We collected 679 integrated performances in four summary and opinion tasks, which were rated by six trained student raters. They are to become writing tutors for first-year students. We utilized a many-facet Rasch model to investigate rater severity, reliability, consistency, and scale functioning. Using thematic analysis, we analyzed think-aloud protocols, retrospective and focus group interviews with the raters. Findings showed that the rating scale overall functions as intended and is perceived by the raters as valid operationalization of the integrated construct. FACETS analyses revealed reasonable reliabilities, yet exposed local issues with certain criteria and band levels. This is corroborated by the challenges reported by the raters, which they mainly attributed to the complexities inherent in such an assessment. Applying Weir’s (2005) framework in a mixed-methods approach facilitated the interpretation of the quantitative findings and yielded insights into potential validity threads. • FACET analyses show reasonable reliabilities and scale functioning. • Mixed-methods approach facilitates interpreting the quantitative findings. • Raters perceive rating scale as valid operationalization of integrated construct. • Applying Weir’s socio-cognitive framework reveals potential validity threads. • Raters attribute challenges to the complexities inherent in integrated writing.

Journal: Assessing Writing
Published: 2024-10-01
DOI: 10.1016/j.asw.2024.100894
CompPile: Search in CompPile ↗
Open Access: OA PDF Hybrid
Topics: assessment peer tutoring qualitative research
Export: BibTeX RIS

Citation Context

Cited by in this index (1)

Shackleton et al. (2026)

Developing a rating scale for written intralinguistic mediation in a local context

Assessing Writing

References (59) · 10 in this index

Attali (2015)

A comparison of newly-trained and experienced raters on a standardized writing assessment

Language Testing ↗
Barkaoui (2010)

Do ESL essay raters' evaluation criteria change with experience? A mixed-methods, cross-s…

TESOL Quarterly ↗
Barkaoui (2010)

Variability in ESL essay rating processes: The role of the rating scale and rater experience

Language Assessment Quarterly ↗
Barkaoui (2011)

Think-aloud protocols in research on essay rating: An empirical study of their veridicali…

Language Testing ↗
Braun (2006)

Using thematic analysis in psychology

Qualitative Research in Psychology ↗

Show all 59 →

Chan et al. (2015)

Developing rubrics to assess the reading-into-writing skills: A case study

Assessing Writing
Chan (2023)

Towards more valid scoring criteria for integrated reading-writing and listening-writing …

Language Testing ↗
Charters (2003)

The use of think-aloud methods in qualitative research. An introduction to think-aloud methods

Brock Education
Cheong (2019)

Effects of intertextual processing on L2 integrated writing

Journal of Second Language Writing ↗
Collins (2014)

Cognitive interviewing practice
Cohen (2011)

Research Methods in Education
Council of Europe (2001). Common European Framework of Reference for Languages: Learning, teaching, assessmen…
Creswell (2018)

Designing and conducting mixed methods research
Crossley et al. (2011)

The Development of Writing Proficiency as a Function of Grade Level: A Linguist…

Written Communication
Cumming (2013)

Assessing Integrated Writing Tasks for Academic Purposes: Promises and Perils

Language Assessment Quarterly ↗
Cumming (2002)

Decision making while rating ESL/EFL writing tasks: A descriptive framework

Modern Language Journal ↗
Cumming (2016)

Students’ writing from sources for academic purposes: A synthesis of recent research

Journal of English for Academic Purposes ↗
Deygers (2015)

Determining the scoring validity of a co-constructed CEFR-based rating scale

Language Testing ↗
Eckes (2012)

Operational rater types in writing assessment: Linking rater cognition to rater behavior

Language Assessment Quarterly ↗
Eckes (2015)

Introduction to Many-facet Rasch measurement: Analysing and evaluating rater-mediated assessments (2nd Revised and updated edition
Frey (1991)

The group interview in social research

The Social Science Journal ↗
Gebril et al. (2014)

Assembling validity evidence for assessing academic writing: Rater reactions to…

Assessing Writing
Harsch, C., Koval, V., Delgado-Osorio, X. & Hartig, J. (2024). Usability of CEFR Companion Volume scales for …

↗
Harsch et al. (2012)

Adapting CEF-descriptors for rating purposes: Validation by a combined rater tr…

Assessing Writing
Jia (2023)

Rater cognitive processes in integrated writing tasks: From the perspective of problem-solving

Lang Test Asia ↗
KMK, Ed. (2014). Bildungsstandards für die fortgeführte Fremdsprache (Englisch/Französisch) für die Allgemein…
Keck (2006)

The use of paraphrase in summary writing: A comparison of L1 and L2 writers

Journal of Second Language Writing ↗
Knoch (2011)

Rating scales for diagnostic assessment of writing: What should they look like …

Assessing Writing
Knoch (2018)

Validation of rating processes within an argument-based framework

Language Testing ↗
Knoch (2021)

Revisiting rating scale development for rater-mediated language performance assessments: …

Language Testing ↗
Knoch et al. (2013)

A closer look at integrated writing tasks: Towards a more focussed definition f…

Assessing Writing
Kukartz (2019)

Analyzing Qualitative Data with MAXQDA
Lestari (2023)

Operationalizing the reading-into-writing construct in analytic rating scales: Effects of…

Language Testing ↗
Li (2014)

The role of reading and writing in summarization as an integrated task

Language Testing in Asia ↗
Li (2021)

Development and validation of a rating scale for summarization as an integrated task

Asian-Pacific Journal of Second and Foreign Language Education ↗
Lim (2011)

The development and maintenance of rating quality in performance writing assessment: A lo…

Language Testing ↗
Linacre (2004)

Optimizing rating scale category effectiveness

Introduction to Rasch measurement. Theory, models, and applications
Linacre (2023)

A user's guide to FACETS Rasch-Model computer programs

Program Manual
Lumley (2005)

Assessing Second Language Writing: The Rater's Perspective
Motz (2005)

Englisch oder Deutsch in Internationalen Studiengängen? [English or German in international degree programs?
Murray (2016)

Standards of English in higher education: issues, challenges and strategies
Myford (2012)

Rater cognition research: Some possible directions for the future

Educational Measurement: Issues and Practice ↗
Myford (2004)

Detecting and measuring rater effects using Many-Facet Rasch Measurement: Part I. In

Introduction to Rasch measurement: Theory, models, and applications
Myford (2004)

Detecting and measuring rater effects using many-facet Rasch measurement: Part II. In

Introduction to Rasch Measurement: Theory, models, and applications
Ono (2019)

Holistic and analytic assessments of the TOEFL iBT® integrated writing task.

JLTA (Japan Language Testing Association) Journal
Pearson Education (2015). Global Scale of English Learning Objectives for Academic English. Pearson Education…
Plakans (2015)

Assessment myths: Applying second language research to classroom teaching
Ringwald (2018)

Und dann kommt das große Erwachen an der Uni“ – Eine explorative Bedarfsanalyse

Fremdsprachen und Hochschule
Rölke (2012)

The ItemBuilder: A graphical authoring system for complex item development

Proceedings of E-Learn: World Conference on E-Learning in Corporate, Government, Healthcare, and Higher Education
Rupp, A.A., Vock, M., Harsch, C., & Köller, O. (2008). Developing standards-based assessment tasks for Englis…
Shi (2004)

Textual Borrowing in Second-Language Writing

Written Communication
Shin (2015)

What accounts for integrated reading-to-write task scores?

Language Testing ↗
Sormunen, E., Heinstrom, J., Romu, L. & Turunen, R. (2012). A Method for the Analysis of Information Use in S…
Spivey (1989)

Readers as writers composing from sources

Reading Research Quarterly ↗
Uludag et al. (2022)

Validating a rubric for assessing integrated writing in an EAP context

Assessing Writing
Wang et al. (2017)

Evaluating rater accuracy and perception for integrated writing assessments usi…

Assessing Writing
Weir (2005)

Language testing and validation: an evidence-based approach
Xie (2023)

Assessing source use: Summary vs. reading-to-write argumentative essay

Assessing Writing
V.E.R.B.I. Software 2021, MAXQDA 2022, computer program, VERBI Software, Berlin.

CrossRef global citation count: 2 View in citation network → Build reading path →

Validating an integrated reading-into-writing scale with trained university students

Abstract

Citation Context

Cited by in this index (1)

References (59) · 10 in this index

Related Articles