AAW dev: system nodepools track resource usage #2001

Jose-Matsuda · 2024-12-11T14:53:49Z

EPIC
Follow up to changing the workload sizes

We want to observe if there are any workloads being booted off / acting weirdly. This is to validate the work done in #1992

jacek-dudek · 2024-12-27T16:06:22Z

Here is a table of resource usage metrics that compares the discrepancies between actual usage and resource requests before request adjustments were made and after requests were adjusted. All workloads whose requests were adjusted track much better (in some cases by a factor of 10 or more) their new requests.
filtered-resource-utilization-on-aaw-dev-system-nodes.ods

Jose-Matsuda · 2024-12-30T13:49:08Z

Reviewed the pods in the .ods file and LGTM;
The metrics on grafana are fine(memory and CPU are well provisioned).
The pods on k9s have 0 restarts which is good meaning it's not getting resource starved and crashloopbackoffing.

Jose-Matsuda assigned jacek-dudek Dec 11, 2024

Jose-Matsuda mentioned this issue Dec 11, 2024

AAW Dev: Resource Utilization #1998

Open

10 tasks

Jose-Matsuda closed this as completed Dec 30, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

AAW dev: system nodepools track resource usage #2001

AAW dev: system nodepools track resource usage #2001

Jose-Matsuda commented Dec 11, 2024

jacek-dudek commented Dec 27, 2024

Jose-Matsuda commented Dec 30, 2024

AAW dev: system nodepools track resource usage #2001

AAW dev: system nodepools track resource usage #2001

Comments

Jose-Matsuda commented Dec 11, 2024

jacek-dudek commented Dec 27, 2024

Jose-Matsuda commented Dec 30, 2024