perf(replay): reduce postgres queries in recording consumer using get_from_cache #77365

aliu39 · 2024-09-11T23:20:01Z

@cmanallen pointed out the queries we make in _handle_breadcrumb, used to check feature flags and project options, could overload Postgres as we scale. To fix this we can do the query at the top-level and use get_from_cache

…_from_cache

src/sentry/replays/consumers/recording_buffered.py

src/sentry/replays/usecases/ingest/__init__.py

codecov · 2024-09-11T23:51:44Z

Codecov Report

Attention: Patch coverage is 86.66667% with 2 lines in your changes missing coverage. Please review.

✅ All tests successful. No failed tests found.

Files with missing lines	Patch %	Lines
src/sentry/replays/usecases/ingest/dom_index.py	83.33%	1 Missing and 1 partial ⚠️

Additional details and impacted files

@@             Coverage Diff             @@
##           master   #77365       +/-   ##
===========================================
- Coverage   88.40%   78.18%   -10.22%     
===========================================
  Files        2998     6959     +3961     
  Lines      186451   308986   +122535     
  Branches    30634    50556    +19922     
===========================================
+ Hits       164826   241590    +76764     
- Misses      15602    60936    +45334     
- Partials     6023     6460      +437

src/sentry/replays/usecases/ingest/dom_index.py

cmanallen · 2024-09-12T13:26:31Z

src/sentry/replays/consumers/recording_buffered.py

@@ -294,8 +295,9 @@ def process_message(buffer: RecordingBuffer, message: bytes) -> None:
                else None
            )

+        project = Project.objects.get_from_cache(decoded_message["project_id"])


How much memory will this consume?

For the cache? I don't know. Got the inspiration from occurrence_consumer.py

we already are usually caching the project for other places in ingest, so it probably won't be very much additional if any

src/sentry/replays/usecases/ingest/dom_index.py

sentry-io · 2024-09-24T00:30:19Z

Suspect Issues

This pull request was deployed and Sentry observed the following issues:

‼️ Project.DoesNotExist: Project matching query does not exist. sentry.silo.base in override View Issue
‼️ AttributeError: 'list' object has no attribute 'get' sentry.replays.usecases.ingest.dom_index in cre... View Issue
‼️ OperationalError: OperationalError('server closed the connection unexpectedly\n\tThis probably means the server ter... sentry.models.options.project_option in reload_... View Issue

_{Did you find this useful? React with a 👍 or 👎}

perf(replay): reduce postgres queries in recording consumer using get…

0e671ca

…_from_cache

aliu39 requested a review from a team as a code owner September 11, 2024 23:20

github-actions bot added the Scope: Backend Automatically applied to PRs that change backend components label Sep 11, 2024

vercel bot deployed to Preview September 11, 2024 23:20 View deployment

aliu39 commented Sep 11, 2024

View reviewed changes

src/sentry/replays/consumers/recording_buffered.py Outdated Show resolved Hide resolved

aliu39 commented Sep 11, 2024

View reviewed changes

src/sentry/replays/usecases/ingest/__init__.py Show resolved Hide resolved

JoshFerge approved these changes Sep 11, 2024

View reviewed changes

aliu39 requested a review from cmanallen September 11, 2024 23:24

cmanallen requested changes Sep 12, 2024

View reviewed changes

src/sentry/replays/usecases/ingest/dom_index.py Outdated Show resolved Hide resolved

cmanallen reviewed Sep 12, 2024

View reviewed changes

aliu39 added 2 commits September 13, 2024 14:04

Move should_report queries up to get_user_actions

3c66aed

Shorten var names

5ba752c

aliu39 requested a review from cmanallen September 13, 2024 21:05

aliu39 mentioned this pull request Sep 13, 2024

ref(replay): try 5s rage/dead click timeout for select orgs, using options #77325

Closed

vercel bot deployed to Preview September 13, 2024 21:10 View deployment

Merge branch 'master' into aliu/reduce-dom-index-queries

338f4dc

vercel bot deployed to Preview September 18, 2024 21:50 View deployment

Update unit test param type

f3e6ce6

vercel bot deployed to Preview September 18, 2024 22:18 View deployment

Use kwarg in recording_buffered

670f08e

vercel bot deployed to Preview September 18, 2024 23:38 View deployment

cmanallen requested changes Sep 19, 2024

View reviewed changes

src/sentry/replays/usecases/ingest/dom_index.py Outdated Show resolved Hide resolved

src/sentry/replays/usecases/ingest/dom_index.py Outdated Show resolved Hide resolved

select_related on organization

d98c2dc

aliu39 requested a review from cmanallen September 19, 2024 20:05

vercel bot deployed to Preview September 19, 2024 20:08 View deployment

cmanallen approved these changes Sep 19, 2024

View reviewed changes

aliu39 enabled auto-merge (squash) September 19, 2024 21:00

Merge branch 'master' into aliu/reduce-dom-index-queries

e8f66ab

vercel bot deployed to Preview September 19, 2024 21:24 View deployment

aliu39 added 2 commits September 19, 2024 14:25

Update should_report docstrings

1f0524f

Fix merge

1bd3ce8

aliu39 disabled auto-merge September 19, 2024 21:28

vercel bot deployed to Preview September 19, 2024 21:31 View deployment

Fix test merge

b5b3707

vercel bot deployed to Preview September 20, 2024 18:50 View deployment

aliu39 and others added 4 commits September 20, 2024 13:32

Rm select related

adeebad

🛠️ apply pre-commit fixes

fcf0145

Rm select related 2

efaa6ed

🛠️ apply pre-commit fixes

103328b

vercel bot deployed to Preview September 20, 2024 20:38 View deployment

aliu39 merged commit f68f0d0 into master Sep 20, 2024
49 of 50 checks passed

aliu39 deleted the aliu/reduce-dom-index-queries branch September 20, 2024 22:15

github-actions bot locked and limited conversation to collaborators Oct 9, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

perf(replay): reduce postgres queries in recording consumer using get_from_cache #77365

perf(replay): reduce postgres queries in recording consumer using get_from_cache #77365

aliu39 commented Sep 11, 2024 •

edited

Loading

codecov bot commented Sep 11, 2024 •

edited

Loading

cmanallen Sep 12, 2024

aliu39 Sep 12, 2024

JoshFerge Sep 17, 2024

sentry-io bot commented Sep 24, 2024 •

edited

Loading

perf(replay): reduce postgres queries in recording consumer using get_from_cache #77365

perf(replay): reduce postgres queries in recording consumer using get_from_cache #77365

Conversation

aliu39 commented Sep 11, 2024 • edited Loading

codecov bot commented Sep 11, 2024 • edited Loading

Codecov Report

cmanallen Sep 12, 2024

Choose a reason for hiding this comment

aliu39 Sep 12, 2024

Choose a reason for hiding this comment

JoshFerge Sep 17, 2024

Choose a reason for hiding this comment

sentry-io bot commented Sep 24, 2024 • edited Loading

Suspect Issues

aliu39 commented Sep 11, 2024 •

edited

Loading

codecov bot commented Sep 11, 2024 •

edited

Loading

sentry-io bot commented Sep 24, 2024 •

edited

Loading