Case 统计分析报告

基于 253 个 Case 的 SOM 元素提取统计 | 2026-02-12

253
总 Case 数
6
类别数
10,163
总 GT 元素数
70
元素类型数

Part 1: 四维评估体系说明

核心概念:四个维度各自独立评估,每个维度只看一个方面

评估系统从 GT(Ground Truth)和 Gen(生成代码)的渲染 SVG 中提取语义元素(SOM),然后在四个独立维度上分别比较这些元素。 四个维度各管一件事,互不干扰:

Type 比较的值:元素的细粒度类型,如 "node:circle"、"path:closed"、"node:resistorshape" 等 GT 有 4 个 node:circle,Gen 有 0 个但有 3 个 node:rectangle → circle 全部未匹配。能区分形状差异。
Text 比较的值:元素携带的文本字符串 "BGaugeTheory"、"(1, 2)" 等 逐个精确匹配。GT 有文本 "hello",Gen 也有 "hello" → 匹配 1 个。
BBox 比较的值:元素的 BBox 坐标 (x1, y1, x2, y2),单位 bp GT 元素在 (50, 20, 300, 250),Gen 元素在 (53, 18, 298, 252) → 差值均 ≤10bp → 匹配。
Color 比较的值:元素的颜色值 "#ff0000"、"#000" 等(stroke/fill/color) GT path 颜色 #ff0000,Gen path 颜色 #fe0000 → Delta-E = 0.5 → 相似度 0.995。

Type 维度使用细粒度类型 — 能区分形状差异

Type 维度不是简单地按 "path"、"node" 等粗类型计数,而是使用细粒度类型 key
NodeElement:按 shape 细分 → node:circle, node:rectangle, node:resistorshape
PathElement:按开闭细分 → path:open(开放路径), path:closed(闭合路径)
ComponentElement:按元件类型细分 → component:R(电阻), component:C(电容)等
DataSeriesElement:按数据源细分 → data_series:table, data_series:expression

这意味着:如果 GT 中有 4 个 node:circle,而 Gen 把它们画成了 node:rectangle,Type 维度立即检测到差异
电路图中 72 种不同的元件形状(电阻、电容、二极管、运放等)都能被精确区分。

Type 类型 — "元素种类和数量对不对?"

按细粒度类型分组:node:circle 和 node:rectangle 是不同类
匹配逻辑:按细粒度类型分组计数 → matched = Σ min(GT, Gen)
匹配值举例:"node:circle"=4, "path:open"=10, "node:resistorshape"=2
能检测形状变化(circle→rectangle)和路径类型变化(open→closed)

Text 文本 — "写了什么字?"

提取元素文本,精确字符串匹配(贪心,一对一消耗)
来源:NODE.text_content, TEXT.content, DataPoint "(x,y)"
匹配值举例:"BGaugeTheory"="BGaugeTheory" ✓
只有携带文本的元素参与(path 通常无文本)

BBox 位置 — "画在哪里?"

比较每个元素的 BBox 边界框 (x1,y1,x2,y2)
容差:四个坐标差值均 ≤ 10bp(约 3.5mm)
匹配值举例:(50.0, 20.0, 300.0, 250.0) ≈ (52.0, 19.0, 299.0, 251.0) ✓
贪心匹配,不区分元素类型(一个 path 的 bbox 可能匹配另一个 node 的 bbox)

Color 颜色 — "什么颜色?"

提取 PATH 的 stroke/fill 和 TEXT 的 color 值
按类型分组 → 全排列(≤6个)或贪心匹配
匹配值举例:#000 vs #000 → Delta-E=0 → similarity=1.0
只有有颜色属性的元素参与(scope/picture 无颜色)

SOM 元素类型参考(语义类型需要 semantic_spy.sty 注入,基本 SVG 类型始终可提取)

类型中文名说明全局数量参与维度
path : closedSVG 路径(closed)线条、曲线、形状轮廓(stroke/fill颜色),子类型:closed2,957Type, BBox, Color
path : openSVG 路径(open)线条、曲线、形状轮廓(stroke/fill颜色),子类型:open2,521Type, BBox, Color
node : rectangleTikZ 节点(rectangle)含标签文字和形状(circle/rectangle等),子类型:rectangle1,642Type, Text, BBox
scopeTikZ scope 容器作用域/分组,无视觉内容1,176Type, BBox
text文本元素独立的文本内容494Type, Text, BBox, Color
pictureTikZ picture 框架整个图片的根容器345Type, BBox
data_point数据点数据系列中的一个 (x,y) 坐标点343Type, Text, BBox
node : circleTikZ 节点(circle)含标签文字和形状(circle/rectangle等),子类型:circle270Type, Text, BBox
data_series : unknown数据系列(unknown)pgfplots 中的一条数据曲线,子类型:unknown106Type, BBox
rectangle矩形SVG <rect> 矩形元素60Type, BBox
node : vsourceAMshapeTikZ 节点(vsourceAMshape)含标签文字和形状(circle/rectangle等),子类型:vsourceAMshape48Type, Text, BBox
axis坐标轴pgfplots 坐标轴(含x/y标签、标题)31Type, Text, BBox
node : resistorshapeTikZ 节点(resistorshape)含标签文字和形状(circle/rectangle等),子类型:resistorshape28Type, Text, BBox
node : currarrowTikZ 节点(currarrow)含标签文字和形状(circle/rectangle等),子类型:currarrow20Type, Text, BBox
node : ocircTikZ 节点(ocirc)含标签文字和形状(circle/rectangle等),子类型:ocirc12Type, Text, BBox
node : regular polygonTikZ 节点(regular polygon)含标签文字和形状(circle/rectangle等),子类型:regular polygon7Type, Text, BBox
node : vsourcesquareshapeTikZ 节点(vsourcesquareshape)含标签文字和形状(circle/rectangle等),子类型:vsourcesquareshape6Type, Text, BBox
node : groundTikZ 节点(ground)含标签文字和形状(circle/rectangle等),子类型:ground5Type, Text, BBox
node : shortshapeTikZ 节点(shortshape)含标签文字和形状(circle/rectangle等),子类型:shortshape5Type, Text, BBox
node : circTikZ 节点(circ)含标签文字和形状(circle/rectangle等),子类型:circ5Type, Text, BBox
node : flowarrowTikZ 节点(flowarrow)含标签文字和形状(circle/rectangle等),子类型:flowarrow4Type, Text, BBox
node : rotaryswitchTikZ 节点(rotaryswitch)含标签文字和形状(circle/rectangle等),子类型:rotaryswitch4Type, Text, BBox
circle圆形SVG <circle> 圆形元素3Type, BBox
node : veeTikZ 节点(vee)含标签文字和形状(circle/rectangle等),子类型:vee3Type, Text, BBox
node : op ampTikZ 节点(op amp)含标签文字和形状(circle/rectangle等),子类型:op amp3Type, Text, BBox
node : emptydiodeshapeTikZ 节点(emptydiodeshape)含标签文字和形状(circle/rectangle等),子类型:emptydiodeshape3Type, Text, BBox
node : cuteinductorshapeTikZ 节点(cuteinductorshape)含标签文字和形状(circle/rectangle等),子类型:cuteinductorshape2Type, Text, BBox
node : nigfeteTikZ 节点(nigfete)含标签文字和形状(circle/rectangle等),子类型:nigfete2Type, Text, BBox
node : nigfetebulkTikZ 节点(nigfetebulk)含标签文字和形状(circle/rectangle等),子类型:nigfetebulk2Type, Text, BBox
node : ampshapeTikZ 节点(ampshape)含标签文字和形状(circle/rectangle等),子类型:ampshape2Type, Text, BBox
node : wavesTikZ 节点(waves)含标签文字和形状(circle/rectangle等),子类型:waves2Type, Text, BBox
node : mixerTikZ 节点(mixer)含标签文字和形状(circle/rectangle等),子类型:mixer2Type, Text, BBox
node : inputarrowTikZ 节点(inputarrow)含标签文字和形状(circle/rectangle等),子类型:inputarrow2Type, Text, BBox
node : triodeTikZ 节点(triode)含标签文字和形状(circle/rectangle等),子类型:triode2Type, Text, BBox
node : en ampTikZ 节点(en amp)含标签文字和形状(circle/rectangle等),子类型:en amp2Type, Text, BBox
node : muxdemuxTikZ 节点(muxdemux)含标签文字和形状(circle/rectangle等),子类型:muxdemux2Type, Text, BBox
node : european xnor portTikZ 节点(european xnor port)含标签文字和形状(circle/rectangle等),子类型:european xnor port2Type, Text, BBox
node : ieeestd and portTikZ 节点(ieeestd and port)含标签文字和形状(circle/rectangle等),子类型:ieeestd and port2Type, Text, BBox
node : vsourceshapeTikZ 节点(vsourceshape)含标签文字和形状(circle/rectangle等),子类型:vsourceshape2Type, Text, BBox
node : cspstshapeTikZ 节点(cspstshape)含标签文字和形状(circle/rectangle等),子类型:cspstshape2Type, Text, BBox
node : cute spdt up arrowTikZ 节点(cute spdt up arrow)含标签文字和形状(circle/rectangle等),子类型:cute spdt up arrow2Type, Text, BBox
node : and gate CDHTikZ 节点(and gate CDH)含标签文字和形状(circle/rectangle等),子类型:and gate CDH2Type, Text, BBox
node : or gate USTikZ 节点(or gate US)含标签文字和形状(circle/rectangle等),子类型:or gate US2Type, Text, BBox
node : nand gate CDHTikZ 节点(nand gate CDH)含标签文字和形状(circle/rectangle等),子类型:nand gate CDH2Type, Text, BBox
node : americaninductorshapeTikZ 节点(americaninductorshape)含标签文字和形状(circle/rectangle等),子类型:americaninductorshape1Type, Text, BBox
node : fullgenericshapeTikZ 节点(fullgenericshape)含标签文字和形状(circle/rectangle等),子类型:fullgenericshape1Type, Text, BBox
node : nmosTikZ 节点(nmos)含标签文字和形状(circle/rectangle等),子类型:nmos1Type, Text, BBox
node : potentiometershapeTikZ 节点(potentiometershape)含标签文字和形状(circle/rectangle等),子类型:potentiometershape1Type, Text, BBox
node : double bipoleTikZ 节点(double bipole)含标签文字和形状(circle/rectangle等),子类型:double bipole1Type, Text, BBox
node : inst ampTikZ 节点(inst amp)含标签文字和形状(circle/rectangle等),子类型:inst amp1Type, Text, BBox
node : vccTikZ 节点(vcc)含标签文字和形状(circle/rectangle等),子类型:vcc1Type, Text, BBox
node : micshapeTikZ 节点(micshape)含标签文字和形状(circle/rectangle等),子类型:micshape1Type, Text, BBox
node : loudspeakershapeTikZ 节点(loudspeakershape)含标签文字和形状(circle/rectangle等),子类型:loudspeakershape1Type, Text, BBox
node : fd op ampTikZ 节点(fd op amp)含标签文字和形状(circle/rectangle等),子类型:fd op amp1Type, Text, BBox
node : oscillatorTikZ 节点(oscillator)含标签文字和形状(circle/rectangle等),子类型:oscillator1Type, Text, BBox
node : tlgroundTikZ 节点(tlground)含标签文字和形状(circle/rectangle等),子类型:tlground1Type, Text, BBox
node : osjumpershapeTikZ 节点(osjumpershape)含标签文字和形状(circle/rectangle等),子类型:osjumpershape1Type, Text, BBox
node : csjumpershapeTikZ 节点(csjumpershape)含标签文字和形状(circle/rectangle等),子类型:csjumpershape1Type, Text, BBox
node : rdsjumpershapeTikZ 节点(rdsjumpershape)含标签文字和形状(circle/rectangle等),子类型:rdsjumpershape1Type, Text, BBox
node : ieeestd xnor portTikZ 节点(ieeestd xnor port)含标签文字和形状(circle/rectangle等),子类型:ieeestd xnor port1Type, Text, BBox
node : dipchipTikZ 节点(dipchip)含标签文字和形状(circle/rectangle等),子类型:dipchip1Type, Text, BBox
node : qfpchipTikZ 节点(qfpchip)含标签文字和形状(circle/rectangle等),子类型:qfpchip1Type, Text, BBox
node : cvsourceshapeTikZ 节点(cvsourceshape)含标签文字和形状(circle/rectangle等),子类型:cvsourceshape1Type, Text, BBox
node : emptypdiodeshapeTikZ 节点(emptypdiodeshape)含标签文字和形状(circle/rectangle等),子类型:emptypdiodeshape1Type, Text, BBox
node : generic diode IECTikZ 节点(generic diode IEC)含标签文字和形状(circle/rectangle等),子类型:generic diode IEC1Type, Text, BBox
node : diamondpoleTikZ 节点(diamondpole)含标签文字和形状(circle/rectangle等),子类型:diamondpole1Type, Text, BBox
node : batteryshapeTikZ 节点(batteryshape)含标签文字和形状(circle/rectangle等),子类型:batteryshape1Type, Text, BBox
node : capacitorshapeTikZ 节点(capacitorshape)含标签文字和形状(circle/rectangle等),子类型:capacitorshape1Type, Text, BBox
node : nand gate USTikZ 节点(nand gate US)含标签文字和形状(circle/rectangle等),子类型:nand gate US1Type, Text, BBox
node : cylinderTikZ 节点(cylinder)含标签文字和形状(circle/rectangle等),子类型:cylinder1Type, Text, BBox
component电路元件circuitikz 元件(R/C/L等)0Type, Text, BBox
coordinate坐标点TikZ coordinate 定义0Type, BBox
ellipse椭圆SVG <ellipse> 椭圆元素0Type, BBox
fill填充路径TikZ fill 命令生成0Type, BBox, Color
filldraw填充+描边路径TikZ filldraw 命令生成0Type, BBox, Color
legend图例pgfplots 图例0Type, BBox
line直线SVG <line> 线段元素0Type, BBox
polygon多边形SVG <polygon> 多边形元素0Type, BBox
polyline折线SVG <polyline> 折线元素0Type, BBox
title标题图表标题0Type, BBox
unknown未知类型无法识别的元素0Type

Part 2: 六大类 F1 总览

各类别四维 F1 雷达图

3d_shapes_geometry

charts

chemical_expressions

circuit_diagrams

graph_structures

planar_geometry

类别 × 维度 平均 F1 热力图

类别CasesGT元素数Type F1Text F1BBox F1Color F1
3d_shapes_geometry301,48482.5%97.3%67.3%87.3%
charts282,22083.2%91.4%67.0%82.0%
chemical_expressions501,51777.4%81.7%46.2%77.9%
circuit_diagrams491,11268.4%88.6%48.2%83.2%
graph_structures502,39778.6%94.3%68.1%85.1%
planar_geometry461,43376.1%95.0%52.3%77.1%

Part 3: 各类别元素类型详情

3d_shapes_geometry
30 cases 1,484 elements Avg: 49.5 Type:82% Text:97% BBox:67% Color:87%

元素类型分布

元素类型数量占比
path : open SVG 路径(open) 435 29.3%
path : closed SVG 路径(closed) 306 20.6%
node : rectangle TikZ 节点(rectangle) 303 20.4%
scope TikZ scope 容器 284 19.1%
data_point 数据点 66 4.4%
picture TikZ picture 框架 43 2.9%
data_series : unknown 数据系列(unknown) 24 1.6%
axis 坐标轴 10 0.7%
node : circle TikZ 节点(circle) 8 0.5%
rectangle 矩形 3 0.2%
node : cylinder TikZ 节点(cylinder) 1 0.1%
text 文本元素 1 0.1%

各维度参与元素数

Type
1,484
所有元素参与
Text
361
有文本的元素
BBox
1,443
有 BBox 的元素
Color
695
有颜色的元素

代表性 Case: 3d_shapes_geometry/scidiagram_5161

Type 96% Text 100% BBox 92% Color 97%
Type 维度 F1=96.20%
匹配逻辑:按细粒度类型分组(node:circle, path:open 等),比较各类型的数量。matched = min(GT数量, Gen数量)。node:circle 和 node:rectangle 是不同类型。
细粒度类型GT 数量Gen 数量匹配数(计算过程)匹配率
node:rectangle56min(5,6)=5
path:closed2625min(26,25)=25
path:open76min(7,6)=6
picture11min(1,1)=1
scope11min(1,1)=1
合计4039 38
precision = 38/39 = 97.44%  |  recall = 38/40 = 95.00%  |  F1 = 96.20%
Text 维度 F1=100.00%
匹配逻辑:从元素中提取文本(NODE标签、TEXT内容、DataPoint坐标值),精确字符串匹配(贪心)
GT 有文本的元素: 5 个  |  Gen 有文本的元素: 5 个  |  匹配: 5 个
GT IDGT TypeGT 文本值匹配结果Gen ID状态
node-7nodej+1= j+1node-7
node-8nodei+1= i+1node-8
node-9nodej= jnode-9
node-10nodei= inode-10
node-11nodei+2= i+2node-11
precision = 5/5 = 100.00%  |  recall = 5/5 = 100.00%  |  F1 = 100.00%
BBox 维度 F1=97.44%
匹配逻辑:提取每个元素的 BBox (x1,y1,x2,y2),四坐标差值均 ≤ 10bp 则匹配成功(贪心)
GT 有 BBox 元素: 40 个  |  Gen 有 BBox 元素: 38 个  |  匹配: 38 个
GT IDTypeGT BBox (x1,y1,x2,y2)Gen BBox坐标差值状态
scope-1scope(-40.1, -53.3, 82.8, -13.0)(-40.1, -53.3, 82.8, -13.0)|Δ|=(0.0, 0.0, 0.0, 0.0)
picture-2picture(-40.1, -53.3, 82.8, -13.0)(-40.1, -53.3, 82.8, -13.0)|Δ|=(0.0, 0.0, 0.0, 0.0)
path-001path(7.3, -36.7, 7.7, -36.3)(6.5, -37.5, 8.5, -35.5)|Δ|=(0.8, 0.8, 0.8, 0.8)
path-002path(7.3, -36.7, 7.7, -36.3)(6.5, -37.5, 8.5, -35.5)|Δ|=(0.8, 0.8, 0.8, 0.8)
path-003path(60.2, -23.9, 61.2, -22.9)(60.2, -23.9, 61.2, -22.9)|Δ|=(0.0, 0.0, 0.0, 0.0)
path-004path(60.2, -23.9, 61.2, -22.9)(60.2, -23.9, 61.2, -22.9)|Δ|=(0.0, 0.0, 0.0, 0.0)
node-7node(61.7, -31.1, 82.8, -22.4)(61.7, -31.1, 82.8, -22.4)|Δ|=(0.0, 0.0, 0.0, 0.0)
path-005path(-1.1, -52.7, 61.8, -23.5)(-1.4, -52.5, 61.8, -24.7)|Δ|=(0.3, 0.2, 0.0, 1.2)
path-006path(-1.1, -52.7, 61.8, -23.5)(-1.4, -52.5, 61.8, -24.7)|Δ|=(0.3, 0.2, 0.0, 1.2)
path-007path(-1.2, -46.1, 60.5, -13.6)(-1.4, -46.3, 57.2, -13.6)|Δ|=(0.2, 0.1, 3.2, 0.0)
path-008path(-1.2, -46.1, 60.5, -13.6)(-1.4, -46.3, 57.2, -13.6)|Δ|=(0.2, 0.1, 3.2, 0.0)
path-009path(-1.4, -46.3, 60.7, -23.4)(-1.4, -46.3, 57.2, -24.7)|Δ|=(0.0, 0.0, 3.5, 1.3)
path-013path(7.5, -36.5, 28.2, -13.5)无匹配-
path-025path(28.4, -52.5, 61.8, -13.6)无匹配-
precision = 38/38 = 100.00%  |  recall = 38/40 = 95.00%  |  F1 = 97.44%
Color 维度 F1=96.77%
匹配逻辑:提取 PATH stroke/fill 和 TEXT color,按元素类型分组,使用 Delta-E CIE76 颜色相似度匹配(全排列/贪心)
GT 总颜色数: 32  |  Gen 总颜色数: 30  |  总相似度: 30.00
元素类型GT 颜色值Gen 颜色值组相似度
path32 个
#000, #f00, #f00, #99f, #fff, #99f
30 个
#000, #f00, #f00, #99f, #fff, #99f
30.00 / 30
precision = 30.00/30 = 100.00%  |  recall = 30.00/32 = 93.75%  |  F1 = 96.77%
charts
28 cases 2,220 elements Avg: 79.3 Type:83% Text:91% BBox:67% Color:82%

元素类型分布

元素类型数量占比
path : closed SVG 路径(closed) 704 31.7%
scope TikZ scope 容器 500 22.5%
node : rectangle TikZ 节点(rectangle) 373 16.8%
data_point 数据点 277 12.5%
path : open SVG 路径(open) 205 9.2%
data_series : unknown 数据系列(unknown) 82 3.7%
picture TikZ picture 框架 45 2.0%
axis 坐标轴 21 0.9%
node : circle TikZ 节点(circle) 7 0.3%
rectangle 矩形 6 0.3%

各维度参与元素数

Type
2,220
所有元素参与
Text
622
有文本的元素
BBox
2,150
有 BBox 的元素
Color
900
有颜色的元素

代表性 Case: charts/scidiagram_0360

Type 74% Text 90% BBox 69% Color 80%
Type 维度 F1=77.14%
匹配逻辑:按细粒度类型分组(node:circle, path:open 等),比较各类型的数量。matched = min(GT数量, Gen数量)。node:circle 和 node:rectangle 是不同类型。
细粒度类型GT 数量Gen 数量匹配数(计算过程)匹配率
axis11min(1,1)=1
data_point64min(6,4)=4
data_series:unknown64min(6,4)=4
node:circle04min(0,4)=0
node:rectangle1610min(16,10)=10
path:closed1517min(15,17)=15
path:open144min(14,4)=4
picture22min(2,2)=2
scope2014min(20,14)=14
合计8060 54
precision = 54/60 = 90.00%  |  recall = 54/80 = 67.50%  |  F1 = 77.14%
Text 维度 F1=90.00%
匹配逻辑:从元素中提取文本(NODE标签、TEXT内容、DataPoint坐标值),精确字符串匹配(贪心)
GT 有文本的元素: 22 个  |  Gen 有文本的元素: 18 个  |  匹配: 18 个
GT IDGT TypeGT 文本值匹配结果Gen ID状态
node-1node0= 0node-1
node-2node0:2= 0:2node-2
node-3node0:4= 0:4node-3
node-4node0:6= 0:6node-4
node-5node0:8= 0:8node-5
node-6node1= 1node-6
node-7node0= 0node-7
node-8node1= 1node-8
node-9node2= 2node-9
node-10node3= 3node-10
pt-4-1data_point(0, 0)= (0, 0)pt-3-1
pt-4-2data_point(1, 1)= (1, 1)pt-3-2
pt-6-1data_point(0, 2)= (0, 2)pt-4-1
pt-6-2data_point(1, 3)= (1, 3)pt-4-2
node-11nodel1= l1node-11
pt-5-1data_point(0, 1)无匹配-
pt-5-2data_point(1, 2)无匹配-
node-15nodel3无匹配-
node-16nodel3无匹配-
precision = 18/18 = 100.00%  |  recall = 18/22 = 81.82%  |  F1 = 90.00%
BBox 维度 F1=81.75%
匹配逻辑:提取每个元素的 BBox (x1,y1,x2,y2),四坐标差值均 ≤ 10bp 则匹配成功(贪心)
GT 有 BBox 元素: 79 个  |  Gen 有 BBox 元素: 58 个  |  匹配: 56 个
GT IDTypeGT BBox (x1,y1,x2,y2)Gen BBox坐标差值状态
scope-1scope(-55.2, -66.8, 178.0, 94.6)(-55.2, -66.8, 183.8, 94.6)|Δ|=(0.0, 0.0, 5.9, 0.0)
picture-2picture(-55.2, -66.8, 178.0, 94.6)(-55.2, -66.8, 183.8, 94.6)|Δ|=(0.0, 0.0, 5.9, 0.0)
scope-3scope(-55.2, -66.8, 178.0, 94.6)(-55.2, -66.8, 183.8, 94.6)|Δ|=(0.0, 0.0, 5.9, 0.0)
picture-4picture(-55.2, -66.8, 178.0, 94.6)(-55.2, -66.8, 183.8, 94.6)|Δ|=(0.0, 0.0, 5.9, 0.0)
scope-5scope(-55.2, -66.8, 139.1, 94.6)(-55.2, -66.8, 139.1, 94.6)|Δ|=(0.0, 0.0, 0.0, 0.0)
scope-6scope(-39.0, -66.8, 122.9, 94.6)(-39.0, -66.8, 122.9, 94.6)|Δ|=(0.0, 0.0, 0.0, 0.0)
path-001path(-39.0, -66.8, 122.9, 94.6)(-39.0, -66.8, 122.9, 94.6)|Δ|=(0.0, 0.0, 0.0, 0.0)
scope-7scope(-55.2, -53.4, 139.1, 81.1)(-55.2, -53.4, 139.1, 81.1)|Δ|=(0.0, 0.0, 0.0, 0.0)
path-002path(-55.2, -53.4, 139.1, 81.1)(-55.2, -53.4, 139.1, 81.1)|Δ|=(0.0, 0.0, 0.0, 0.0)
path-003path(-55.2, -66.8, 139.1, 94.6)(-55.2, -66.8, 139.1, 94.6)|Δ|=(0.0, 0.0, 0.0, 0.0)
node-1node(-26.8, 61.2, -22.6, 68.1)(-26.8, 61.2, -22.6, 68.1)|Δ|=(0.0, 0.0, 0.0, 0.0)
node-2node(-26.8, 61.2, -15.0, 68.1)(-26.8, 61.2, -15.0, 68.1)|Δ|=(0.0, 0.0, 0.0, 0.0)
path-004path(-39.0, 36.3, 122.9, 81.1)无匹配-
series-2data_series(-39.0, -8.5, 122.9, 36.3)无匹配-
scope-9scope(-39.0, -8.5, 122.9, 36.3)无匹配-
path-005path(-39.0, -8.5, 122.9, 36.3)无匹配-
series-4data_series(-41.0, 34.3, 124.9, 83.1)无匹配-
scope-11scope(-41.0, 34.3, 124.9, 83.1)无匹配-
series-5data_series(-41.0, -10.5, 124.9, 38.3)无匹配-
scope-14scope(-41.0, -10.5, 124.9, 38.3)无匹配-
precision = 56/58 = 96.55%  |  recall = 56/79 = 70.89%  |  F1 = 81.75%
Color 维度 F1=80.17%
匹配逻辑:提取 PATH stroke/fill 和 TEXT color,按元素类型分组,使用 Delta-E CIE76 颜色相似度匹配(全排列/贪心)
GT 总颜色数: 29  |  Gen 总颜色数: 21  |  总相似度: 20.04
元素类型GT 颜色值Gen 颜色值组相似度
path29 个
#808080, #808080, #000, #00f, #f00, #734d26
21 个
#808080, #808080, #000, #f00, #00f, #00c
20.04 / 21
precision = 20.04/21 = 95.44%  |  recall = 20.04/29 = 69.11%  |  F1 = 80.17%
chemical_expressions
50 cases 1,517 elements Avg: 30.3 Type:77% Text:82% BBox:46% Color:78%

元素类型分布

元素类型数量占比
path : open SVG 路径(open) 604 39.8%
text 文本元素 366 24.1%
path : closed SVG 路径(closed) 318 21.0%
scope TikZ scope 容器 111 7.3%
picture TikZ picture 框架 108 7.1%
node : rectangle TikZ 节点(rectangle) 10 0.7%

各维度参与元素数

Type
1,517
所有元素参与
Text
376
有文本的元素
BBox
1,494
有 BBox 的元素
Color
852
有颜色的元素
无匹配数据
circuit_diagrams
49 cases 1,112 elements Avg: 22.7 Type:68% Text:89% BBox:48% Color:83%

元素类型分布

元素类型数量占比
path : closed SVG 路径(closed) 313 28.1%
path : open SVG 路径(open) 293 26.3%
node : rectangle TikZ 节点(rectangle) 111 10.0%
text 文本元素 89 8.0%
scope TikZ scope 容器 49 4.4%
picture TikZ picture 框架 49 4.4%
node : vsourceAMshape TikZ 节点(vsourceAMshape) 48 4.3%
node : resistorshape TikZ 节点(resistorshape) 28 2.5%
node : currarrow TikZ 节点(currarrow) 20 1.8%
node : ocirc TikZ 节点(ocirc) 12 1.1%
node : vsourcesquareshape TikZ 节点(vsourcesquareshape) 6 0.5%
node : ground TikZ 节点(ground) 5 0.4%
node : shortshape TikZ 节点(shortshape) 5 0.4%
node : circ TikZ 节点(circ) 5 0.4%
node : flowarrow TikZ 节点(flowarrow) 4 0.4%
node : rotaryswitch TikZ 节点(rotaryswitch) 4 0.4%
node : vee TikZ 节点(vee) 3 0.3%
node : op amp TikZ 节点(op amp) 3 0.3%
node : emptydiodeshape TikZ 节点(emptydiodeshape) 3 0.3%
node : cuteinductorshape TikZ 节点(cuteinductorshape) 2 0.2%
node : nigfete TikZ 节点(nigfete) 2 0.2%
node : nigfetebulk TikZ 节点(nigfetebulk) 2 0.2%
node : ampshape TikZ 节点(ampshape) 2 0.2%
node : waves TikZ 节点(waves) 2 0.2%
node : mixer TikZ 节点(mixer) 2 0.2%
node : inputarrow TikZ 节点(inputarrow) 2 0.2%
node : triode TikZ 节点(triode) 2 0.2%
node : en amp TikZ 节点(en amp) 2 0.2%
node : muxdemux TikZ 节点(muxdemux) 2 0.2%
node : european xnor port TikZ 节点(european xnor port) 2 0.2%
node : ieeestd and port TikZ 节点(ieeestd and port) 2 0.2%
node : vsourceshape TikZ 节点(vsourceshape) 2 0.2%
node : cspstshape TikZ 节点(cspstshape) 2 0.2%
node : cute spdt up arrow TikZ 节点(cute spdt up arrow) 2 0.2%
node : and gate CDH TikZ 节点(and gate CDH) 2 0.2%
node : or gate US TikZ 节点(or gate US) 2 0.2%
node : nand gate CDH TikZ 节点(nand gate CDH) 2 0.2%
node : americaninductorshape TikZ 节点(americaninductorshape) 1 0.1%
node : fullgenericshape TikZ 节点(fullgenericshape) 1 0.1%
node : nmos TikZ 节点(nmos) 1 0.1%
node : potentiometershape TikZ 节点(potentiometershape) 1 0.1%
node : double bipole TikZ 节点(double bipole) 1 0.1%
node : inst amp TikZ 节点(inst amp) 1 0.1%
node : vcc TikZ 节点(vcc) 1 0.1%
node : micshape TikZ 节点(micshape) 1 0.1%
node : loudspeakershape TikZ 节点(loudspeakershape) 1 0.1%
node : fd op amp TikZ 节点(fd op amp) 1 0.1%
node : oscillator TikZ 节点(oscillator) 1 0.1%
node : tlground TikZ 节点(tlground) 1 0.1%
node : osjumpershape TikZ 节点(osjumpershape) 1 0.1%
node : csjumpershape TikZ 节点(csjumpershape) 1 0.1%
node : rdsjumpershape TikZ 节点(rdsjumpershape) 1 0.1%
node : ieeestd xnor port TikZ 节点(ieeestd xnor port) 1 0.1%
node : dipchip TikZ 节点(dipchip) 1 0.1%
node : qfpchip TikZ 节点(qfpchip) 1 0.1%
node : cvsourceshape TikZ 节点(cvsourceshape) 1 0.1%
node : emptypdiodeshape TikZ 节点(emptypdiodeshape) 1 0.1%
node : generic diode IEC TikZ 节点(generic diode IEC) 1 0.1%
node : diamondpole TikZ 节点(diamondpole) 1 0.1%
node : batteryshape TikZ 节点(batteryshape) 1 0.1%
node : capacitorshape TikZ 节点(capacitorshape) 1 0.1%
node : nand gate US TikZ 节点(nand gate US) 1 0.1%
rectangle 矩形 1 0.1%

各维度参与元素数

Type
1,112
所有元素参与
Text
200
有文本的元素
BBox
914
有 BBox 的元素
Color
575
有颜色的元素

代表性 Case: circuit_diagrams/scidiagram_1748

Type 90% Text 100% BBox 24% Color 92%
Type 维度 F1=90.91%
匹配逻辑:按细粒度类型分组(node:circle, path:open 等),比较各类型的数量。matched = min(GT数量, Gen数量)。node:circle 和 node:rectangle 是不同类型。
细粒度类型GT 数量Gen 数量匹配数(计算过程)匹配率
node:capacitorshape01min(0,1)=0
node:currarrow22min(2,2)=2
node:rectangle22min(2,2)=2
node:resistorshape21min(2,1)=1
path:closed44min(4,4)=4
path:open45min(4,5)=4
picture11min(1,1)=1
scope11min(1,1)=1
合计1617 15
precision = 15/17 = 88.24%  |  recall = 15/16 = 93.75%  |  F1 = 90.91%
Text 维度 F1=100.00%
匹配逻辑:从元素中提取文本(NODE标签、TEXT内容、DataPoint坐标值),精确字符串匹配(贪心)
GT 有文本的元素: 2 个  |  Gen 有文本的元素: 2 个  |  匹配: 2 个
GT IDGT TypeGT 文本值匹配结果Gen ID状态
node-10nodei1= i1node-10
node-23nodei1= i1node-23
precision = 2/2 = 100.00%  |  recall = 2/2 = 100.00%  |  F1 = 100.00%
BBox 维度 F1=88.00%
匹配逻辑:提取每个元素的 BBox (x1,y1,x2,y2),四坐标差值均 ≤ 10bp 则匹配成功(贪心)
GT 有 BBox 元素: 12 个  |  Gen 有 BBox 元素: 13 个  |  匹配: 11 个
GT IDTypeGT BBox (x1,y1,x2,y2)Gen BBox坐标差值状态
scope-1scope(-66.0, -66.6, -9.3, -26.4)(-66.0, -66.6, -9.3, -20.4)|Δ|=(0.0, 0.0, 0.0, 6.0)
picture-2picture(-66.0, -66.6, -9.3, -26.4)(-66.0, -66.6, -9.3, -20.4)|Δ|=(0.0, 0.0, 0.0, 6.0)
path-001path(-66.0, -60.7, -9.3, -60.7)(-66.0, -54.7, -9.3, -54.7)|Δ|=(0.0, 6.0, 0.0, 6.0)
path-003path(-17.3, -62.7, -13.0, -58.7)(-23.2, -56.7, -19.0, -52.7)|Δ|=(6.0, 6.0, 6.0, 6.0)
path-004path(-17.3, -62.7, -13.0, -58.7)(-23.2, -56.7, -19.0, -52.7)|Δ|=(6.0, 6.0, 6.0, 6.0)
node-10node(-65.7, -38.9, -59.3, -30.8)(-65.7, -33.0, -59.3, -24.9)|Δ|=(0.0, 6.0, 0.0, 6.0)
path-005path(-66.0, -32.3, -9.3, -32.3)(-66.0, -26.4, -9.3, -26.4)|Δ|=(0.0, 6.0, 0.0, 6.0)
path-006path(-53.9, -38.3, -21.4, -26.4)(-53.9, -32.3, -21.4, -20.4)|Δ|=(0.0, 6.0, 0.0, 6.0)
path-007path(-62.2, -34.3, -58.0, -30.3)(-62.2, -28.4, -58.0, -24.4)|Δ|=(0.0, 6.0, 0.0, 6.0)
path-008path(-62.2, -34.3, -58.0, -30.3)(-62.2, -28.4, -58.0, -24.4)|Δ|=(0.0, 6.0, 0.0, 6.0)
node-23node(-65.7, -38.9, -59.3, -30.8)(-65.7, -33.0, -59.3, -24.9)|Δ|=(0.0, 6.0, 0.0, 6.0)
path-002path(-53.9, -66.6, -21.4, -54.7)无匹配-
precision = 11/13 = 84.62%  |  recall = 11/12 = 91.67%  |  F1 = 88.00%
Color 维度 F1=92.31%
匹配逻辑:提取 PATH stroke/fill 和 TEXT color,按元素类型分组,使用 Delta-E CIE76 颜色相似度匹配(全排列/贪心)
GT 总颜色数: 6  |  Gen 总颜色数: 7  |  总相似度: 6.00
元素类型GT 颜色值Gen 颜色值组相似度
path6 个
#000, #000, #000, #000, #000, #000
7 个
#000, #000, #000, #000, #000, #000
6.00 / 6
precision = 6.00/7 = 85.71%  |  recall = 6.00/6 = 100.00%  |  F1 = 92.31%
graph_structures
50 cases 2,397 elements Avg: 47.9 Type:79% Text:94% BBox:68% Color:85%

元素类型分布

元素类型数量占比
path : closed SVG 路径(closed) 902 37.6%
path : open SVG 路径(open) 662 27.6%
node : rectangle TikZ 节点(rectangle) 495 20.7%
node : circle TikZ 节点(circle) 115 4.8%
scope TikZ scope 容器 101 4.2%
picture TikZ picture 框架 50 2.1%
text 文本元素 37 1.5%
rectangle 矩形 30 1.3%
circle 圆形 3 0.1%
node : regular polygon TikZ 节点(regular polygon) 2 0.1%

各维度参与元素数

Type
2,397
所有元素参与
Text
525
有文本的元素
BBox
2,278
有 BBox 的元素
Color
1,316
有颜色的元素

代表性 Case: graph_structures/scidiagram_4579

Type 56% Text 100% BBox 78% Color 78%
Type 维度 F1=58.33%
匹配逻辑:按细粒度类型分组(node:circle, path:open 等),比较各类型的数量。matched = min(GT数量, Gen数量)。node:circle 和 node:rectangle 是不同类型。
细粒度类型GT 数量Gen 数量匹配数(计算过程)匹配率
node:diamond08min(0,8)=0
node:ellipse01min(0,1)=0
node:rectangle134min(13,4)=4
path:closed011min(0,11)=0
path:open1615min(16,15)=15
picture11min(1,1)=1
scope11min(1,1)=1
合计3141 21
precision = 21/41 = 51.22%  |  recall = 21/31 = 67.74%  |  F1 = 58.33%
Text 维度 F1=100.00%
匹配逻辑:从元素中提取文本(NODE标签、TEXT内容、DataPoint坐标值),精确字符串匹配(贪心)
GT 有文本的元素: 13 个  |  Gen 有文本的元素: 13 个  |  匹配: 13 个
GT IDGT TypeGT 文本值匹配结果Gen ID状态
node-1nodeˆ= ˆnode-1
node-2nodeˆ= ˆnode-2
node-3nodeˆ= ˆnode-3
node-4nodeˆ= ˆnode-4
node-5nodeˆ= ˆnode-5
node-6nodeˆ= ˆnode-6
node-7nodeˆ= ˆnode-7
node-8nodeˆ= ˆnode-8
node-9node1= 1node-9
node-10node1:5= 1:5node-10
node-11node2= 2node-11
node-12node3= 3node-12
node-13node4= 4node-13
precision = 13/13 = 100.00%  |  recall = 13/13 = 100.00%  |  F1 = 100.00%
BBox 维度 F1=83.33%
匹配逻辑:提取每个元素的 BBox (x1,y1,x2,y2),四坐标差值均 ≤ 10bp 则匹配成功(贪心)
GT 有 BBox 元素: 31 个  |  Gen 有 BBox 元素: 41 个  |  匹配: 30 个
GT IDTypeGT BBox (x1,y1,x2,y2)Gen BBox坐标差值状态
scope-1scope(-167.2, -61.5, 108.9, 165.5)(-167.3, -66.8, 114.4, 165.8)|Δ|=(0.0, 5.3, 5.6, 0.3)
picture-2picture(-167.2, -61.5, 108.9, 165.5)(-167.3, -66.8, 114.4, 165.8)|Δ|=(0.0, 5.3, 5.6, 0.3)
node-1node(-167.0, 160.8, -163.1, 164.7)(-167.0, 161.1, -163.1, 165.0)|Δ|=(0.0, 0.3, 0.0, 0.3)
node-2node(-167.0, 160.8, -163.1, 164.7)(-167.0, 161.1, -163.1, 165.0)|Δ|=(0.0, 0.3, 0.0, 0.3)
node-3node(-167.0, 160.8, -163.1, 164.7)(-167.0, 161.1, -163.1, 165.0)|Δ|=(0.0, 0.3, 0.0, 0.3)
node-4node(-167.0, 160.8, -163.1, 164.7)(-167.0, 161.1, -163.1, 165.0)|Δ|=(0.0, 0.3, 0.0, 0.3)
node-5node(-167.0, 160.8, -163.1, 164.7)(-167.0, 161.1, -163.1, 165.0)|Δ|=(0.0, 0.3, 0.0, 0.3)
node-6node(-167.0, 160.8, -163.1, 164.7)(-167.0, 161.1, -163.1, 165.0)|Δ|=(0.0, 0.3, 0.0, 0.3)
node-7node(-167.0, 160.8, -163.1, 164.7)(-167.0, 161.1, -163.1, 165.0)|Δ|=(0.0, 0.3, 0.0, 0.3)
node-8node(-167.0, 160.8, -163.1, 164.7)(-167.0, 161.1, -163.1, 165.0)|Δ|=(0.0, 0.3, 0.0, 0.3)
path-001path(-61.2, 51.9, 2.6, 94.4)(-61.2, 53.4, 0.6, 94.7)|Δ|=(0.0, 1.5, 1.9, 0.3)
path-002path(-61.2, 23.5, -39.9, 94.4)(-61.2, 23.8, -40.0, 94.7)|Δ|=(0.0, 0.3, 0.0, 0.3)
path-016path(-61.2, 80.2, 108.9, 94.4)无匹配-
precision = 30/41 = 73.17%  |  recall = 30/31 = 96.77%  |  F1 = 83.33%
Color 维度 F1=78.05%
匹配逻辑:提取 PATH stroke/fill 和 TEXT color,按元素类型分组,使用 Delta-E CIE76 颜色相似度匹配(全排列/贪心)
GT 总颜色数: 16  |  Gen 总颜色数: 25  |  总相似度: 16.00
元素类型GT 颜色值Gen 颜色值组相似度
path16 个
#000, #000, #000, #000, #000, #000
25 个
#000, #000, #000, #000, #000, #000
16.00 / 16
precision = 16.00/25 = 64.00%  |  recall = 16.00/16 = 100.00%  |  F1 = 78.05%
planar_geometry
46 cases 1,433 elements Avg: 31.2 Type:76% Text:95% BBox:52% Color:77%

元素类型分布

元素类型数量占比
path : closed SVG 路径(closed) 414 28.9%
node : rectangle TikZ 节点(rectangle) 350 24.4%
path : open SVG 路径(open) 322 22.5%
node : circle TikZ 节点(circle) 140 9.8%
scope TikZ scope 容器 131 9.1%
picture TikZ picture 框架 50 3.5%
rectangle 矩形 20 1.4%
node : regular polygon TikZ 节点(regular polygon) 5 0.3%
text 文本元素 1 0.1%

各维度参与元素数

Type
1,433
所有元素参与
Text
296
有文本的元素
BBox
1,251
有 BBox 的元素
Color
606
有颜色的元素

代表性 Case: planar_geometry/scidiagram_4378

Type 95% Text 100% BBox 44% Color 96%
Type 维度 F1=95.65%
匹配逻辑:按细粒度类型分组(node:circle, path:open 等),比较各类型的数量。matched = min(GT数量, Gen数量)。node:circle 和 node:rectangle 是不同类型。
细粒度类型GT 数量Gen 数量匹配数(计算过程)匹配率
node:rectangle89min(8,9)=8
path:closed99min(9,9)=9
path:open43min(4,3)=3
picture11min(1,1)=1
scope11min(1,1)=1
合计2323 22
precision = 22/23 = 95.65%  |  recall = 22/23 = 95.65%  |  F1 = 95.65%
Text 维度 F1=100.00%
匹配逻辑:从元素中提取文本(NODE标签、TEXT内容、DataPoint坐标值),精确字符串匹配(贪心)
GT 有文本的元素: 6 个  |  Gen 有文本的元素: 6 个  |  匹配: 6 个
GT IDGT TypeGT 文本值匹配结果Gen ID状态
node-3noder= rnode-3
node-4nodex= xnode-4
node-6nodey2= y2node-7
node-7node"2= "2node-8
node-9nodey1= y1node-10
node-10node"1= "1node-11
precision = 6/6 = 100.00%  |  recall = 6/6 = 100.00%  |  F1 = 100.00%
BBox 维度 F1=0.00%
匹配逻辑:提取每个元素的 BBox (x1,y1,x2,y2),四坐标差值均 ≤ 10bp 则匹配成功(贪心)
GT 有 BBox 元素: 21 个  |  Gen 有 BBox 元素: 20 个  |  匹配: 0 个
GT IDTypeGT BBox (x1,y1,x2,y2)Gen BBox坐标差值状态
scope-1scope(-69.6, -69.6, 115.5, 79.2)无匹配-
picture-2picture(-69.6, -69.6, 115.5, 79.2)无匹配-
path-001path(-35.6, 1.3, 87.2, 50.9)无匹配-
path-002path(-69.6, -69.6, 72.1, 72.1)无匹配-
path-003path(-69.6, -69.6, 72.1, 72.1)无匹配-
path-004path(1.3, -48.9, 51.4, 1.3)无匹配-
node-3node(1.5, -3.1, 4.9, 1.3)无匹配-
path-005path(-0.7, -0.7, 3.2, 3.2)无匹配-
precision = 0/20 = 0.00%  |  recall = 0/21 = 0.00%  |  F1 = 0.00%
Color 维度 F1=96.00%
匹配逻辑:提取 PATH stroke/fill 和 TEXT color,按元素类型分组,使用 Delta-E CIE76 颜色相似度匹配(全排列/贪心)
GT 总颜色数: 13  |  Gen 总颜色数: 12  |  总相似度: 12.00
元素类型GT 颜色值Gen 颜色值组相似度
path13 个
#0f0, #fcc, #f00, #f00, #f00, #ccf
12 个
#0f0, #fcc, #f00, #f00, #ccf, #00f
12.00 / 12
precision = 12.00/12 = 100.00%  |  recall = 12.00/13 = 92.31%  |  F1 = 96.00%