Scaling Code-Assisted Chain-of-Thoughts and Instructions for Model Reasoning Article Swipe

PDF

Xīn Gào , Zihang Pan , Yu Li , Juntao Li , Changming He ·

YOU? · · 2025 · Open Access · · DOI: https://doi.org/10.48550/arxiv.2510.04081

Reasoning capability is pivotal for Large Language Models (LLMs) to solve complex tasks, yet achieving reliable and scalable reasoning remains challenging. While Chain-of-Thought (CoT) prompting has become a mainstream approach, existing methods often suffer from uncontrolled generation, insufficient quality, and limited diversity in reasoning paths. Recent efforts leverage code to enhance CoT by grounding reasoning in executable steps, but such methods are typically constrained to predefined mathematical problems, hindering scalability and generalizability. In this work, we propose Caco (Code-Assisted Chain-of-ThOught), a novel framework that automates the synthesis of high-quality, verifiable, and diverse instruction-CoT reasoning data through code-driven augmentation. Unlike prior work, Caco first fine-tunes a code-based CoT generator on existing math and programming solutions in a unified code format, then scales the data generation to a large amount of diverse reasoning traces. Crucially, we introduce automated validation via code execution and rule-based filtering to ensure logical correctness and structural diversity, followed by reverse-engineering filtered outputs into natural language instructions and language CoTs to enrich task adaptability. This closed-loop process enables fully automated, scalable synthesis of reasoning data with guaranteed executability. Experiments on our created Caco-1.3M dataset demonstrate that Caco-trained models achieve strong competitive performance on mathematical reasoning benchmarks, outperforming existing strong baselines. Further analysis reveals that Caco's code-anchored verification and instruction diversity contribute to superior generalization across unseen tasks. Our work establishes a paradigm for building self-sustaining, trustworthy reasoning systems without human intervention.

Related Topics

Truth And Reconciliation Commission Of Canada

2025 Nba Draft

28 Years Later

Mahmood Mamdani

Concepts

No concepts available.

Metadata

Type: preprint
Language: en
Landing Page: http://arxiv.org/abs/2510.04081
PDF: https://arxiv.org/pdf/2510.04081
OA Status: green
OpenAlex ID: https://openalex.org/W4416373971

All OpenAlex metadata

Raw OpenAlex JSON

OpenAlex ID: https://openalex.org/W4416373971

Canonical identifier for this work in OpenAlex
DOI: https://doi.org/10.48550/arxiv.2510.04081

Digital Object Identifier
Title: Scaling Code-Assisted Chain-of-Thoughts and Instructions for Model Reasoning

Work title
Type: preprint

OpenAlex work type
Language: en

Primary language
Publication year: 2025

Year of publication
Publication date: 2025-10-05

Full publication date if available
Authors: Xīn Gào, Zihang Pan, Yu Li, Juntao Li, Changming He

List of authors in order
Landing page: https://arxiv.org/abs/2510.04081

Publisher landing page
PDF URL: https://arxiv.org/pdf/2510.04081

Direct link to full text PDF
Open access: Yes

Whether a free full text is available
OA status: green

Open access status per OpenAlex
OA URL: https://arxiv.org/pdf/2510.04081

Direct OA link when available
Cited by: 0

Total citation count in OpenAlex

Full payload

id	https://openalex.org/W4416373971
doi	https://doi.org/10.48550/arxiv.2510.04081
ids.doi	https://doi.org/10.48550/arxiv.2510.04081
ids.openalex	https://openalex.org/W4416373971
fwci
type	preprint
title	Scaling Code-Assisted Chain-of-Thoughts and Instructions for Model Reasoning
biblio.issue
biblio.volume
biblio.last_page
biblio.first_page
is_xpac	False
apc_list
apc_paid
language	en
locations[0].id	pmh:oai:arXiv.org:2510.04081
locations[0].is_oa	True
locations[0].source.id	https://openalex.org/S4306400194
locations[0].source.issn
locations[0].source.type	repository
locations[0].source.is_oa	True
locations[0].source.issn_l
locations[0].source.is_core	False
locations[0].source.is_in_doaj	False
locations[0].source.display_name	arXiv (Cornell University)
locations[0].source.host_organization	https://openalex.org/I205783295
locations[0].source.host_organization_name	Cornell University
locations[0].source.host_organization_lineage	https://openalex.org/I205783295
locations[0].license
locations[0].pdf_url	https://arxiv.org/pdf/2510.04081
locations[0].version	submittedVersion
locations[0].raw_type	text
locations[0].license_id
locations[0].is_accepted	False
locations[0].is_published	False
locations[0].raw_source_name
locations[0].landing_page_url	http://arxiv.org/abs/2510.04081
locations[1].id	doi:10.48550/arxiv.2510.04081
locations[1].is_oa	True
locations[1].source.id	https://openalex.org/S4306400194
locations[1].source.issn
locations[1].source.type	repository
locations[1].source.is_oa	True
locations[1].source.issn_l
locations[1].source.is_core	False
locations[1].source.is_in_doaj	False
locations[1].source.display_name	arXiv (Cornell University)
locations[1].source.host_organization	https://openalex.org/I205783295
locations[1].source.host_organization_name	Cornell University
locations[1].source.host_organization_lineage	https://openalex.org/I205783295
locations[1].license
locations[1].pdf_url
locations[1].version
locations[1].raw_type	article
locations[1].license_id
locations[1].is_accepted	False
locations[1].is_published
locations[1].raw_source_name
locations[1].landing_page_url	https://doi.org/10.48550/arxiv.2510.04081
indexed_in	arxiv, datacite
authorships[0].author.id	https://openalex.org/A5100713602
authorships[0].author.orcid	https://orcid.org/0000-0003-0108-6961
authorships[0].author.display_name	Xīn Gào
authorships[0].author_position	middle
authorships[0].raw_author_name	Gao, Xin
authorships[0].is_corresponding	False
authorships[1].author.id	https://openalex.org/A5110830165
authorships[1].author.orcid
authorships[1].author.display_name	Zihang Pan
authorships[1].author_position	middle
authorships[1].raw_author_name	Pan, Zhuoshi
authorships[1].is_corresponding	False
authorships[2].author.id	https://openalex.org/A5100345767
authorships[2].author.orcid	https://orcid.org/0000-0002-4260-1870
authorships[2].author.display_name	Yu Li
authorships[2].author_position	last
authorships[2].raw_author_name	Li, Yu
authorships[2].is_corresponding	False
authorships[3].author.id	https://openalex.org/A5100657514
authorships[3].author.orcid	https://orcid.org/0000-0002-6286-7529
authorships[3].author.display_name	Juntao Li
authorships[3].author_position	middle
authorships[3].raw_author_name	Li, Juntao
authorships[3].is_corresponding	False
authorships[4].author.id	https://openalex.org/A5075805415
authorships[4].author.orcid
authorships[4].author.display_name	Changming He
authorships[4].author_position	middle
authorships[4].raw_author_name	He, Conghui
authorships[4].is_corresponding	False
has_content.pdf	False
has_content.grobid_xml	False
is_paratext	False
open_access.is_oa	True
open_access.oa_url	https://arxiv.org/pdf/2510.04081
open_access.oa_status	green
open_access.any_repository_has_fulltext	False
created_date	2025-10-10T00:00:00
display_name	Scaling Code-Assisted Chain-of-Thoughts and Instructions for Model Reasoning
has_fulltext	False
is_retracted	False
updated_date	2025-11-28T12:28:40.898293
primary_topic
cited_by_count	0
locations_count	2
best_oa_location.id	pmh:oai:arXiv.org:2510.04081
best_oa_location.is_oa	True
best_oa_location.source.id	https://openalex.org/S4306400194
best_oa_location.source.issn
best_oa_location.source.type	repository
best_oa_location.source.is_oa	True
best_oa_location.source.issn_l
best_oa_location.source.is_core	False
best_oa_location.source.is_in_doaj	False
best_oa_location.source.display_name	arXiv (Cornell University)
best_oa_location.source.host_organization	https://openalex.org/I205783295
best_oa_location.source.host_organization_name	Cornell University
best_oa_location.source.host_organization_lineage	https://openalex.org/I205783295
best_oa_location.license
best_oa_location.pdf_url	https://arxiv.org/pdf/2510.04081
best_oa_location.version	submittedVersion
best_oa_location.raw_type	text
best_oa_location.license_id
best_oa_location.is_accepted	False
best_oa_location.is_published	False
best_oa_location.raw_source_name
best_oa_location.landing_page_url	http://arxiv.org/abs/2510.04081
primary_location.id	pmh:oai:arXiv.org:2510.04081
primary_location.is_oa	True
primary_location.source.id	https://openalex.org/S4306400194
primary_location.source.issn
primary_location.source.type	repository
primary_location.source.is_oa	True
primary_location.source.issn_l
primary_location.source.is_core	False
primary_location.source.is_in_doaj	False
primary_location.source.display_name	arXiv (Cornell University)
primary_location.source.host_organization	https://openalex.org/I205783295
primary_location.source.host_organization_name	Cornell University
primary_location.source.host_organization_lineage	https://openalex.org/I205783295
primary_location.license
primary_location.pdf_url	https://arxiv.org/pdf/2510.04081
primary_location.version	submittedVersion
primary_location.raw_type	text
primary_location.license_id
primary_location.is_accepted	False
primary_location.is_published	False
primary_location.raw_source_name
primary_location.landing_page_url	http://arxiv.org/abs/2510.04081
publication_date	2025-10-05
publication_year	2025
referenced_works_count	0
abstract_inverted_index.a	27, 80, 104, 115, 125, 222
abstract_inverted_index.In	72
abstract_inverted_index.by	52, 151
abstract_inverted_index.in	42, 55, 114
abstract_inverted_index.is	2
abstract_inverted_index.of	87, 128, 174
abstract_inverted_index.on	108, 181, 194
abstract_inverted_index.to	9, 49, 64, 124, 143, 162, 213
abstract_inverted_index.we	75, 133
abstract_inverted_index.CoT	51, 106
abstract_inverted_index.Our	219
abstract_inverted_index.and	16, 39, 70, 90, 111, 140, 147, 159, 209
abstract_inverted_index.are	61
abstract_inverted_index.but	58
abstract_inverted_index.for	4, 224
abstract_inverted_index.has	25
abstract_inverted_index.our	182
abstract_inverted_index.the	85, 121
abstract_inverted_index.via	137
abstract_inverted_index.yet	13
abstract_inverted_index.Caco	77, 101
abstract_inverted_index.CoTs	161
abstract_inverted_index.This	166
abstract_inverted_index.code	48, 117, 138
abstract_inverted_index.data	94, 122, 176
abstract_inverted_index.from	34
abstract_inverted_index.into	155
abstract_inverted_index.math	110
abstract_inverted_index.such	59
abstract_inverted_index.task	164
abstract_inverted_index.that	83, 187, 205
abstract_inverted_index.then	119
abstract_inverted_index.this	73
abstract_inverted_index.with	177
abstract_inverted_index.work	220
abstract_inverted_index.(CoT)	23
abstract_inverted_index.Large	5
abstract_inverted_index.While	21
abstract_inverted_index.first	102
abstract_inverted_index.fully	170
abstract_inverted_index.human	231
abstract_inverted_index.large	126
abstract_inverted_index.novel	81
abstract_inverted_index.often	32
abstract_inverted_index.prior	99
abstract_inverted_index.solve	10
abstract_inverted_index.work,	74, 100
abstract_inverted_index.(LLMs)	8
abstract_inverted_index.Caco's	206
abstract_inverted_index.Models	7
abstract_inverted_index.Recent	45
abstract_inverted_index.Unlike	98
abstract_inverted_index.across	216
abstract_inverted_index.amount	127
abstract_inverted_index.become	26
abstract_inverted_index.enrich	163
abstract_inverted_index.ensure	144
abstract_inverted_index.models	189
abstract_inverted_index.paths.	44
abstract_inverted_index.scales	120
abstract_inverted_index.steps,	57
abstract_inverted_index.strong	191, 200
abstract_inverted_index.suffer	33
abstract_inverted_index.tasks,	12
abstract_inverted_index.tasks.	218
abstract_inverted_index.unseen	217
abstract_inverted_index.Further	202
abstract_inverted_index.achieve	190
abstract_inverted_index.complex	11
abstract_inverted_index.created	183
abstract_inverted_index.dataset	185
abstract_inverted_index.diverse	91, 129
abstract_inverted_index.efforts	46
abstract_inverted_index.enables	169
abstract_inverted_index.enhance	50
abstract_inverted_index.format,	118
abstract_inverted_index.limited	40
abstract_inverted_index.logical	145
abstract_inverted_index.methods	31, 60
abstract_inverted_index.natural	156
abstract_inverted_index.outputs	154
abstract_inverted_index.pivotal	3
abstract_inverted_index.process	168
abstract_inverted_index.propose	76
abstract_inverted_index.remains	19
abstract_inverted_index.reveals	204
abstract_inverted_index.systems	229
abstract_inverted_index.through	95
abstract_inverted_index.traces.	131
abstract_inverted_index.unified	116
abstract_inverted_index.without	230
abstract_inverted_index.Language	6
abstract_inverted_index.analysis	203
abstract_inverted_index.building	225
abstract_inverted_index.existing	30, 109, 199
abstract_inverted_index.filtered	153
abstract_inverted_index.followed	150
abstract_inverted_index.language	157, 160
abstract_inverted_index.leverage	47
abstract_inverted_index.paradigm	223
abstract_inverted_index.quality,	38
abstract_inverted_index.reliable	15
abstract_inverted_index.scalable	17, 172
abstract_inverted_index.superior	214
abstract_inverted_index.Caco-1.3M	184
abstract_inverted_index.Reasoning	0
abstract_inverted_index.achieving	14
abstract_inverted_index.approach,	29
abstract_inverted_index.automated	135
abstract_inverted_index.automates	84
abstract_inverted_index.diversity	41, 211
abstract_inverted_index.execution	139
abstract_inverted_index.filtering	142
abstract_inverted_index.framework	82
abstract_inverted_index.generator	107
abstract_inverted_index.grounding	53
abstract_inverted_index.hindering	68
abstract_inverted_index.introduce	134
abstract_inverted_index.problems,	67
abstract_inverted_index.prompting	24
abstract_inverted_index.reasoning	18, 43, 54, 93, 130, 175, 196, 228
abstract_inverted_index.solutions	113
abstract_inverted_index.synthesis	86, 173
abstract_inverted_index.typically	62
abstract_inverted_index.Crucially,	132
abstract_inverted_index.automated,	171
abstract_inverted_index.baselines.	201
abstract_inverted_index.capability	1
abstract_inverted_index.code-based	105
abstract_inverted_index.contribute	212
abstract_inverted_index.diversity,	149
abstract_inverted_index.executable	56
abstract_inverted_index.fine-tunes	103
abstract_inverted_index.generation	123
abstract_inverted_index.guaranteed	178
abstract_inverted_index.mainstream	28
abstract_inverted_index.predefined	65
abstract_inverted_index.rule-based	141
abstract_inverted_index.structural	148
abstract_inverted_index.validation	136
abstract_inverted_index.Experiments	180
abstract_inverted_index.benchmarks,	197
abstract_inverted_index.closed-loop	167
abstract_inverted_index.code-driven	96
abstract_inverted_index.competitive	192
abstract_inverted_index.constrained	63
abstract_inverted_index.correctness	146
abstract_inverted_index.demonstrate	186
abstract_inverted_index.establishes	221
abstract_inverted_index.generation,	36
abstract_inverted_index.instruction	210
abstract_inverted_index.performance	193
abstract_inverted_index.programming	112
abstract_inverted_index.scalability	69
abstract_inverted_index.trustworthy	227
abstract_inverted_index.verifiable,	89
abstract_inverted_index.Caco-trained	188
abstract_inverted_index.challenging.	20
abstract_inverted_index.instructions	158
abstract_inverted_index.insufficient	37
abstract_inverted_index.mathematical	66, 195
abstract_inverted_index.uncontrolled	35
abstract_inverted_index.verification	208
abstract_inverted_index.adaptability.	165
abstract_inverted_index.augmentation.	97
abstract_inverted_index.code-anchored	207
abstract_inverted_index.high-quality,	88
abstract_inverted_index.intervention.	232
abstract_inverted_index.outperforming	198
abstract_inverted_index.(Code-Assisted	78
abstract_inverted_index.executability.	179
abstract_inverted_index.generalization	215
abstract_inverted_index.instruction-CoT	92
abstract_inverted_index.Chain-of-Thought	22
abstract_inverted_index.self-sustaining,	226
abstract_inverted_index.generalizability.	71
abstract_inverted_index.Chain-of-ThOught),	79
abstract_inverted_index.reverse-engineering	152
cited_by_percentile_year
countries_distinct_count	0
institutions_distinct_count	5
citation_normalized_percentile