美国的高考叫什么

美国高考(ACT)数学试题让国内一众AI大模型全军覆灭

一、美国高考简介

美国高考是分层次的,既有高中水平层次的,也有大学水平层次的考试。美国高考主要包括SAT(学术能力评估测试)、SAT 项目测试(原称 SAT II)、ACT(美国大学入学考试)、CLT(经典学习测试)、AP 测试(大学水平课程测试)、托福 (英语作为外语测试)以及GED (普通教育发展)。

主要的大学入学考试是SAT和ACT,而CLT是另一种较新的选择,被少数学校接受。另外还有AP 测试(美名校标配)。

(一)SAT

SAT 有两个主要部分。第一个部分叫做基于证据的阅读和写作,它包括两个测试:阅读测试和写作与语言测试。SAT的第二部分是数学测试,分为两个部分:带计算器的数学测试和不带计算器的数学测试。SAT考试时长为三个小时,不包括休息时间,还有一个可选的50分钟作文。阅读测试和写作与语言测试之间有10分钟的休息时间,数学测试的两部分之间有5分钟的休息时间。

SAT 项目测试(原称 SAT II)是一系列专注于个别科目的大学入学考试。这些考试可以提升你的入学资质。并非所有学校都要求或考虑这些SAT 学科考试。有20种SAT学科考试,这些考试基于高中课程,涵盖历史、英语、外语、科学和数学等领域。

(二)ACT

ACT考试包括四个选择题部分——英语、数学、阅读和科学——还有一个可选的写作部分。一些学院和大学要求或接受ACT写作成绩,所以你可以考虑参加写作部分。

1.数学部分

数学部分报告九个分数:一个是整体部分的分数,另外八个是基于特定数学知识和技能的报告类别分数。每个报告类别所占的百分比大约是:

为高阶数学做准备 (57–60%):这个类别涵盖了学生最近学习的数学,从学生开始将代数作为表达和解决方程的一般方法时开始。这个类别分为五个子类别。

数字与数量 (7–10%):展示对实数和复数系统的理解。学生将理解并能够处理以多种形式表示的数值量,包括整数和有理数指数,以及向量和矩阵。

代数 (12–15%):解决、图形化和建模多种类型的表达式。学生将使用许多不同类型的方程,包括但不限于线性、多项式、根式和指数关系。学生将找到方程组的解,即使它们以简单的矩阵形式表示,并将他们的知识应用于实际应用中。

功能 (12–15%):这一类别的问题测试对函数定义、符号、表示和应用的知识。问题可能包括但不限于线性、根式、分段、多项式和对数函数。学生将对函数进行操作和翻译,并找到和应用图形的重要特征。

几何 (12–15%):定义并应用形状和固体的知识,例如全等和相似关系或表面积和体积测量。理解物体的组合,并求解三角形、圆和其他图形中缺失的值,包括使用三角比和圆锥曲线方程。

统计与概率 (8–12%):描述分布的中心和离散程度,应用和分析数据收集方法,理解并模型双变量数据中的关系,并计算概率,包括相关的样本空间。

整合基本技能(40-43%):这个类别重点测量你综合运用理解和技能解决更复杂问题的能力。问题要求你解决诸如速率和百分比;比例关系;面积、表面积和体积;平均数和中位数;以及以不同方式表示数字等概念。解决涉及链式步骤中结合技能的非常规问题;在不同背景下应用技能;理解联系;以及展示熟练程度的问题。

建模:这个类别代表所有涉及建立、解释、理解、评估和改进模型的问题。每个问题也会被计入上面其他适当的报告类别。这个类别是对你在数学主题中使用建模技巧的总体衡量。

注:所有数学问题都可以不用计算器解决。许多问题最好不用计算器。在决定是否使用计算器时,请使用良好的判断力。例如,对于某些问题,您可能希望先进行草稿计算,以澄清您对问题的看法,然后再使用计算器进行计算。

2.科学部分

科学部分测试在自然科学中所需的解释、分析、评估、推理和解决问题的能力。该部分呈现几个真实的科学场景,每个场景后跟随一些多项选择题。

内容包括生物学、化学、地球/空间科学(例如地质学、天文学和气象学)和物理学。科学部分重点是多维度评估,问题旨在评估科学内容、科学技能和科学实践的结合。

(三)AP测试(大学预修课程测试)

国人都知道“美国高考叫‘SAT’”,其实大部分国人不知道美国还有SAT II以及ACT考试——它们理科部分相当于中国高考的理科卷,除此之外还有AP微积分考试、AP统计学考试、AP化学考试、AP宏观经济学考试、AP微观经济学考试、AP物理学考试、A P计算机考试等大学级别的全球几百万高中精英生(荣誉生)参加的一年一次的考试。

许多高中提供AP(大学预修课程)。AP课程的内容必须经过College Board®的批准,College Board®也是管理SAT和SAT学科考试的同一个组织。AP考试是在五月每个AP课程结束时进行的标准化考试,用于衡量对课程内容和技能的掌握程度。得分范围是1到5。3、4或5的分数有可能获得大学学分。

大多数AP考试的时长为2到3小时。38门考试有所不同,尽管考试的第一部分通常由选择题组成,第二部分由自由回答题组成。

虽然AP成绩通常不被视为大学入学考试,但如果获得了高分,将其包含在大学申请中也是明智的。如果你的AP成绩符合大学获得大学学分的指南,你将需要确保将你的成绩发送到你最终选择上的大学。

二、美国高考(ACT)数学试题

下面是一条来源于https://magoosh.com/act/的ACT数学试题:

x、y都是实数,且满足(x-6)^2+(y-4)^2 ≤100。当x≥0、y≥0时,则满足(x-6)^2+(y-4)^2 ≤100的所有点(x,y)落在特定的区域内,求该区域的面积是多少?

该题的解答见图1、图2:

图 1

图 2

三、测试结果全军覆灭

笔者在昨晚在手机端对国内一众AI大模型就上述美国高考(ACT)数学试题进行测试。参与测试的有Manus、科大讯飞、通义千问、Kimi、DeepSeek 、豆包、腾讯元宝、文小言以及OIOI。结果大跌眼镜,参与测试的均惨败。

笔者留意到,似乎有个别的AI大模型给出的估值大约在193上下,比如:DeepSeeK给出三个完全对不上的值——一个约193.46、一个约150.79(按其精确表达式计算)以及一个约266.16(按其另一个精确表达式计算),估且且将193.46作为答案吧;文小言答案为193.2;腾讯元宝答案为193.13;通义千问约188.99。——它们答案接近193上下,但仍然不是正确答案,无论是精确表达式还是估算值。

至于其他AI大模型就错得更离谱了。

至于估值大约在193上下或与该值相当的精确表达式也错,主要错在积分区间:x∈[0,6+√84]。从下图3可见它们积分时基本少计了直线p右侧的一小块区域,如果把它补上就跟我的答案是一致的,无论是精确表达式还是估算值(注:为了让读者易懂,不采用微积分方法,只是采用高中数学方法来求解)。

图 3

综上所述,Manus、科大讯飞、通义千问、Kimi、DeepSeek 、豆包、腾讯元宝、文小言以及OIOI均以失败告终。

(一)Manus

图 4

图 5

(二)科大讯飞

图 6

图 7

(三)通义千问

图 8

图 9

(四)Kimi

图 10

图 11

(五)DeepSeek

图 12

图 13

(六) 豆包

图 14

图 15

(七) 腾讯元宝

图 16

图 17

图 18

(八) 文小言

图 19

图 20

(九) OIOI

图 21

图 22

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。