3316

Vector processing enhances parallelism through deep pipelines and eliminates data dependencies and control hazards. The architecture includes vector registers and functional units, allowing for efficient operations on vectors with reduced instruction bandwidth. Techniques such as vector-length registers and chaining improve flexibility and performance in vector computations.

Uploaded by

yashkol44

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

7 views7 pages

3316

Uploaded by

yashkol44

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 7

Why Vector Processing

Deep pipeline ==> more parallelism
But more dependences
Need to fetch and issue many instructions (Flynn
bottleneck)

Same issues with multiple-issue processor

Operations on vectors:
No data dependences
No control hazards
Single instn. ==> instn. bandwidth reduced
Well defined memory access pattern
Basic Architecture

Vector-register processors vs. memory-
memory vector processor

DLXV: vector extn. of DLX (vector-register)

Components:
Vector registers (V0..V7), 64-element
Vector functional units:

ADD/SUB, MUL, DIV, Integer, Logical

Each is pipelined, can start a new opn. every cycle
Vector load/store unit: also pipelined
Scalar registers and scalar unit (like in DLX)
Some Vector Instructions

ADDV V1, V2, V3

ADDSV V1, F0, V2

SUBV V1, V2, V3

SUBVS V1, V2, F0

SUBSV V1, F0, V2

Similar for MUL and DIV

LV V1, R1

SV R1, V1
SAXPY/DAXPY Loop

Y = aX + Y (caps ==> vector)
LD F0, a LD F0, a
ADDI R4, Rx, 512 LV V1, Rx
Loop: LD F2, 0(Rx) MULTSV V2, F0, V1
MULTD F2, F0, F2 LV V3, Ry
LD F4, 0(Ry) ADDV V4, V2, V3
ADDD F4, F2, F4 SV Ry, V4
SD 0(Ry), F4
Reduction in instn. bandwidth
ADDI Rx, Rx, 8
Lesser pipeline interlocks
ADDI Ry, Ry, 8
SUB R20, R4, Rx
Estimating Execution Time

Convoy: set of vector instructions which can
begin execution in same cycle
Check for structural, data hazards

For simplicity: convoy must complete before
initiating next convoy

Chime: time taken to execute one vector opn.

Approximations:
Only one instn. can be initiated per cycle
Pipeline setup latency
Adding Flexibility

Vector-length register (VLR), Maximum
vector length (MVL)
MOVI2S VLR, R1
MOVS2I R1, VLR

Vector longer than MVL ==> use strip-mining

Vector stride:
LVWS V1, (R1, R2)
SVWS (R1, R2), V1

Memory-bank conflicts?
Enhancing Vector Performance

Chaining: data-forwarding

Conditional execution:
Vector Mask Register
Some related instructions

SNEV V1, V2

SGTSV F0, V1

CVM

Sparse matrices: scatter-gather
LVI V1, (R1+V2)
SVI (R1+V2), V1

Riscv Boom
No ratings yet
Riscv Boom
85 pages
Lab 3
No ratings yet
Lab 3
1 page
XX-BSC Compact Vector Processing
No ratings yet
XX-BSC Compact Vector Processing
49 pages
FALLSEM2021-22 CSE4001 ETH VL2021220104078 Reference Material I 26-Aug-2021 Module2-SIMD-VectorProcessors
No ratings yet
FALLSEM2021-22 CSE4001 ETH VL2021220104078 Reference Material I 26-Aug-2021 Module2-SIMD-VectorProcessors
16 pages
Computer Architecture Simd Vector Gpu
No ratings yet
Computer Architecture Simd Vector Gpu
16 pages
SIMD
No ratings yet
SIMD
44 pages
GUC_315_61_38694_2023-11-23T11_50_52
No ratings yet
GUC_315_61_38694_2023-11-23T11_50_52
33 pages
Vector
No ratings yet
Vector
38 pages
Unit Iii Data-Level Parallelism in Vector, Simd, and Gpu Architectures
No ratings yet
Unit Iii Data-Level Parallelism in Vector, Simd, and Gpu Architectures
26 pages
7TH_UNIT 4-21EC74H6_CA
No ratings yet
7TH_UNIT 4-21EC74H6_CA
67 pages
7-VECTOR PROCESSING-04-Jan-2020Material - I - 04-Jan-2020 - VECTOR - PROCESSING PDF
No ratings yet
7-VECTOR PROCESSING-04-Jan-2020Material - I - 04-Jan-2020 - VECTOR - PROCESSING PDF
31 pages
Vector
No ratings yet
Vector
42 pages
onur-digitaldesign-2020-lecture19-simd-beforelecture
No ratings yet
onur-digitaldesign-2020-lecture19-simd-beforelecture
64 pages
Vector Processor
No ratings yet
Vector Processor
83 pages
CS7103 - MultiCore Architecture Ppts Unit-II
No ratings yet
CS7103 - MultiCore Architecture Ppts Unit-II
43 pages
Simple Vector Processor Modeled With VHDL
No ratings yet
Simple Vector Processor Modeled With VHDL
6 pages
Vector Processor
No ratings yet
Vector Processor
13 pages
Unit 2 ppt
No ratings yet
Unit 2 ppt
43 pages
19_Computer_Architecture_Vector_processor
No ratings yet
19_Computer_Architecture_Vector_processor
20 pages
Ca Part 3
No ratings yet
Ca Part 3
20 pages
Data-Level Parallelism in Vector, SIMD, and GPU Architectures
No ratings yet
Data-Level Parallelism in Vector, SIMD, and GPU Architectures
58 pages
Onur 447 Spring15 Lecture14 Simd Afterlecture
No ratings yet
Onur 447 Spring15 Lecture14 Simd Afterlecture
60 pages
Unit 3-4
No ratings yet
Unit 3-4
76 pages
COE4590_14_Vector
No ratings yet
COE4590_14_Vector
14 pages
Flynn's Taxonomy: Data-Level Parallelism in Vector, SIMD, and GPU Architectures
No ratings yet
Flynn's Taxonomy: Data-Level Parallelism in Vector, SIMD, and GPU Architectures
28 pages
Chapter 04
No ratings yet
Chapter 04
47 pages
Unit Iii - Aca
No ratings yet
Unit Iii - Aca
13 pages
Lec. 12: Vector Computers: EECS 252 Graduate Computer Architecture
No ratings yet
Lec. 12: Vector Computers: EECS 252 Graduate Computer Architecture
31 pages
Architecture Chapter4 E5 2012
No ratings yet
Architecture Chapter4 E5 2012
92 pages
CH 04. Data-Level Parallelism in Vector, SIMD, and GPU Architectures
No ratings yet
CH 04. Data-Level Parallelism in Vector, SIMD, and GPU Architectures
50 pages
Module 1.6
No ratings yet
Module 1.6
53 pages
module-4-chapter-2
No ratings yet
module-4-chapter-2
42 pages
Organisasi & Arsitektur Komputer
No ratings yet
Organisasi & Arsitektur Komputer
3 pages
Data-Level Parallelism Vector and GPU
No ratings yet
Data-Level Parallelism Vector and GPU
6 pages
Bangabandhu Sheikh Mujibur Rahman Maritime University Bangladesh
No ratings yet
Bangabandhu Sheikh Mujibur Rahman Maritime University Bangladesh
7 pages
26-27 SIMD Architecture
No ratings yet
26-27 SIMD Architecture
33 pages
CA 4 notes
No ratings yet
CA 4 notes
34 pages
VLIW ARCHITECTURE and Pipeline
No ratings yet
VLIW ARCHITECTURE and Pipeline
5 pages
Zareen 6
No ratings yet
Zareen 6
11 pages
17.40 Vector - RISCV 20190611 Vectors
No ratings yet
17.40 Vector - RISCV 20190611 Vectors
26 pages
UNIT-V-Pipeline and Array Processing and Multi Processors
No ratings yet
UNIT-V-Pipeline and Array Processing and Multi Processors
51 pages
Computer Architecture AllClasses-Outline-199-294
No ratings yet
Computer Architecture AllClasses-Outline-199-294
96 pages
23.L20 Multiprocessing Multithreading Vectorization
No ratings yet
23.L20 Multiprocessing Multithreading Vectorization
38 pages
Advanced Computer Architecture: Presented By, Krishna
No ratings yet
Advanced Computer Architecture: Presented By, Krishna
35 pages
l22 Vector
No ratings yet
l22 Vector
32 pages
Chapter 8
No ratings yet
Chapter 8
59 pages
onur-digitaldesign-2020-lecture20-gpu-beforelecture
No ratings yet
onur-digitaldesign-2020-lecture20-gpu-beforelecture
73 pages
CS6461 - Computer Architecture Fall 2016 - Vector Operations
No ratings yet
CS6461 - Computer Architecture Fall 2016 - Vector Operations
47 pages
Module 5 Coa
No ratings yet
Module 5 Coa
11 pages
PS3 Programming Basics: Week 1. SIMD Programming On PPE Materials Are Adapted From The Textbook
No ratings yet
PS3 Programming Basics: Week 1. SIMD Programming On PPE Materials Are Adapted From The Textbook
37 pages
1 Vector Processing: Solutions
No ratings yet
1 Vector Processing: Solutions
16 pages
Lecture ParallelArchTLP-DLP
No ratings yet
Lecture ParallelArchTLP-DLP
52 pages
CA 13 VectorProcessors
No ratings yet
CA 13 VectorProcessors
16 pages
WINSEM2022-23_CSE4001_ETH_VL2022230503160_Reference_Material_I_05-01-2023_2.3_SIMD_VP
No ratings yet
WINSEM2022-23_CSE4001_ETH_VL2022230503160_Reference_Material_I_05-01-2023_2.3_SIMD_VP
25 pages
CSE 820 Graduate Computer Architecture Vectors and Multiprocessor Introduction
No ratings yet
CSE 820 Graduate Computer Architecture Vectors and Multiprocessor Introduction
39 pages
Lec15 x86SIMD
No ratings yet
Lec15 x86SIMD
74 pages
Lec15 x86SIMD
No ratings yet
Lec15 x86SIMD
74 pages
EE6304 Lecture13 Processors
No ratings yet
EE6304 Lecture13 Processors
69 pages
Lec 18-VectorSIMDGPUArchitectures
No ratings yet
Lec 18-VectorSIMDGPUArchitectures
29 pages
MCA - HW - Lecture 7and8 - Prelim
No ratings yet
MCA - HW - Lecture 7and8 - Prelim
146 pages
2014 PPCES Vectorization With OpenMP
No ratings yet
2014 PPCES Vectorization With OpenMP
15 pages
Mastering VMware NSX for vSphere
From Everand
Mastering VMware NSX for vSphere
Elver Sena Sosa
No ratings yet
3313
No ratings yet
3313
59 pages
3314
No ratings yet
3314
23 pages
3310
No ratings yet
3310
26 pages
3325
No ratings yet
3325
5 pages
SL1
No ratings yet
SL1
1 page
Module 5 -Introduction-to-Pentium-Processor
No ratings yet
Module 5 -Introduction-to-Pentium-Processor
15 pages
Intel Optimization Reference Manual V1 050
No ratings yet
Intel Optimization Reference Manual V1 050
895 pages
Computer Architecture 計算機結構: Scoreboard
No ratings yet
Computer Architecture 計算機結構: Scoreboard
36 pages
CA Chap4 CPU NLT2020
No ratings yet
CA Chap4 CPU NLT2020
82 pages
Kannur University Bca III Nov2019 Computer Organization
No ratings yet
Kannur University Bca III Nov2019 Computer Organization
2 pages
Control - Unit Design
No ratings yet
Control - Unit Design
26 pages
Addressing Modes of 8086
No ratings yet
Addressing Modes of 8086
9 pages
Micro Programming
100% (1)
Micro Programming
23 pages
Sap 1
No ratings yet
Sap 1
18 pages
Instruction Pipelining
No ratings yet
Instruction Pipelining
32 pages
Pipeline History
No ratings yet
Pipeline History
30 pages
Advanced Computer Architecture (ACA) Assignment
No ratings yet
Advanced Computer Architecture (ACA) Assignment
16 pages
Horizontal and Vertical Microprogramming
No ratings yet
Horizontal and Vertical Microprogramming
1 page
Delayed Branching
No ratings yet
Delayed Branching
4 pages
Addressing Modes OF 8085: Mr. Gursharan Singh Tatla
No ratings yet
Addressing Modes OF 8085: Mr. Gursharan Singh Tatla
10 pages
Datapath & Single-Cycle MIPS: COMP541
No ratings yet
Datapath & Single-Cycle MIPS: COMP541
39 pages
Lec04 Pipelining Intro&hazards
No ratings yet
Lec04 Pipelining Intro&hazards
77 pages
Advanced Pipe Lining Techniques
No ratings yet
Advanced Pipe Lining Techniques
8 pages
Computer Organization and Architecture Major Advances in Computers
No ratings yet
Computer Organization and Architecture Major Advances in Computers
14 pages
Unit-2.2 Branch Handling
No ratings yet
Unit-2.2 Branch Handling
16 pages
20 Advanced Processor Designs
No ratings yet
20 Advanced Processor Designs
28 pages
Vliw Processors
No ratings yet
Vliw Processors
20 pages
8 DynamicBranchPrediction
No ratings yet
8 DynamicBranchPrediction
8 pages
Risc Properties
No ratings yet
Risc Properties
2 pages
CSO Model Question
No ratings yet
CSO Model Question
5 pages
Control unit-COA
No ratings yet
Control unit-COA
66 pages
COA Unit-3 Slides
No ratings yet
COA Unit-3 Slides
76 pages
Pipelining Numericals
100% (1)
Pipelining Numericals
11 pages

3316

Uploaded by

3316

Uploaded by

Why Vector Processing

You might also like