How invariant and accurate are domain ratings in writing assessment?

Stefanie A. Wind; George Engelhard

doi:10.1016/j.asw.2013.09.002

Assessing Writing Oct 2013

How invariant and accurate are domain ratings in writing assessment?

Stefanie A. Wind University of Georgia ; George Engelhard University of Georgia

Journal: Assessing Writing
Published: 2013-10-01
DOI: 10.1016/j.asw.2013.09.002
CompPile
Open Access: Closed
Topics: assessment
Export: BibTeX RIS

Citation Context

Cited by in this index (7)

Huang et al. (2022)

Individualized feedback to raters in language assessment: Impacts on rater effects

Assessing Writing
Poe et al. (2019)

Evidence of fairness: Twenty-five years of research in Assessing Writing

Assessing Writing
Mendoza et al. (2018)

Examining the validity of an analytic rating scale for a Spanish test for acade…

Assessing Writing
Wind et al. (2017)

Exploring the relationship between textual characteristics and rating quality i…

Assessing Writing
Goodwin (2016)

A Many-Facet Rasch analysis comparing essay rater behavior on an academic Engli…

Assessing Writing

Show all 7 →

Hamp-Lyons (2016)

Farewell to holistic scoring. Part Two: Why build a house with only one brick?

Assessing Writing
Zhang (2016)

Same text different processing? Exploring how raters’ cognitive and meta-cognit…

Assessing Writing

References (47) · 1 in this index

Andrich (1982)

An index of person separation in latent trait theory, the traditional KR.20 indices and t…

Education Research and Perspectives
Barkaoui (2011)

Think-aloud protocols in research on essay rating: An empirical study of their veridicali…

Language Testing ↗
Clauser (2000)

Recurrent issues and recent advances in scoring performance assessments

Applied Psychological, Measurement ↗
Cooper (2009)

The growing (but still limited) importance of evidence in education policy and practice

Journal of Educational Change ↗
DeCarlo (2005)

A model of rater behavior in essay grading based on signal detection theory

Journal of Educational Measurement ↗

Show all 47 →

Eckes (2009)

Many-facet Rasch measurement

Reference supplement to the manual for relating language examinations to the Common European Framework of Reference for Languages: Learning, teaching, assessment (Section H)
Eckes (2011)

Introduction to many-facet Rasch measurement: Analyzing and evaluating rater-mediated assessments
Edgeworth (1890)

The element of chance in competitive examinations

Journal of the Royal Statistical Society
Educational Testing Service (2010)

TOEFL iBT test scores
Elder (2005)

Individual feedback to enhance rater training: Does it work?

Language Assessment Quarterly ↗
Elliot (2005)

On a scale: A social history of writing assessment in America
Engelhard (2002)

Monitoring raters in performance assessments

Large-scale Assessment Programs for All Students: Development, Implementation, and Analysis
Engelhard (2013)

Invariant measurement: Using Rasch Models in the Social, Behavioral and Health Sciences
Georgia Department of Education (2010)

Georgia grade 8 writing assessment interpretive guide
Guilford (1936)

Psychometric methods
Hamp-Lyons (2011)

Writing assessment: Shifting issues, new tools, enduring questions

Assessing Writing
Huff (2010)

The promises and challenges of implementing evidence-centered design in large-scale assessment

Applied Measurement in Education ↗
Johnson (2009)

Assessing performance: Designing, scoring, and validating performance tasks
Karabatsos (2000)

A critique of Rasch residual fit statistics

Journal of Applied Measurement
Knoch (2011)

Investigating the effectiveness of individualized feedback to rating behavior: A longitud…

Language Testing ↗
Landy (1980)

Performance rating

Psychological Bulletin ↗
Linacre (1989)

Many-facet Rasch measurement
Linacre (2007)

Facets: Rasch Measurement Computer Program
Linacre (2010)

Facets Rasch measurement computer program, version 3.67, 1
Lumley (2002)

Assessment criteria in a large-scale writing test: What do they really mean to the raters?

Language Testing ↗
Lumley (1995)

Rater characteristics and rater bias: Implications for training

Language Testing ↗
Messick (1989)

Validity

Educational measurement
Mislevy (2002)

Making sense of data from complex assessments

Applied Measurement in Education ↗
Mullis (2012)

TIMSS 2011 international results in mathematics
Mullis (2012)

TIMSS 2011 international results in reading
Murphy (1991)

Performance appraisal: An organizational perspective
Myford (2012)

Rater cognition research: Some possible directions for the future

Educational Measurement: Issues and Practice ↗
Myford (2003)

Detecting and measuring rater effects using many-facet Rasch measurement: Part I

Journal of Applied Measurement
Myford (2004)

Detecting and measuring rater effects using many-facet Rasch measurement: Part II

Journal of Applied Measurement
Pula (1993)

A model of background influences on holistic raters

Validating holistic scoring for writing assessment: Theoretical and empirical foundations
Rasch (1960)

Probabilistic models for some intelligence and attainment tests Copenhagen: Danish Institute for Educational Research
Saal (1980)

Rating the ratings: Assessing the psychometric quality of rating data

Psychological Bulletin ↗
Smith (2000)

Examining replication effects in Rasch fit statistics

Objective measurement: Theory into practice (Vol. 5)
Sulsky (1988)

Meaning and measurement of performance rating accuracy: Some methodological and theoretic…

Journal of Applied Psychology ↗
U.S. Department of Education (2010)

Race to the top assessment program executive summary
Weigle (1998)

Using FACETS to model rater training effects

Language Testing ↗
Wind (2012)

Examining rating quality in writing assessment: Rater agreement, error, and accuracy

Journal of Applied Measurement
Wolfe (2009)

Item and rater analysis of constructed response items via the multi-faceted Rasch model

Journal of Applied Measurement
Wolfe (2013)

A bootstrap approach to evaluating person and item fit to the Rasch model

Journal of Applied Measurement
Wolfe (2012)

Application of latent trait models to identifying substantively interesting raters

Educational Measurement: Issues and Practice ↗
Wright (1982)

Rating scale analysis: Rasch measurement
Wright (1979)

Best test design: Rasch measurement

CrossRef global citation count: 34 View in citation network → Build reading path →

How invariant and accurate are domain ratings in writing assessment?

Citation Context

Cited by in this index (7)

References (47) · 1 in this index

Related Articles