Ich habe eine Gruppe von Daten im Format: Jede ID ist ein Patient und jeder Wert ist, sagen wir, Blutdruck für die Minute. Ich möchte einen rollierenden Durchschnitt für die 60 Minuten vor und 60 Minuten nach jedem Punkt zu erstellen. Allerdings - wie Sie sehen können, gibt es fehlende Minuten (so kann ich nicht nur Zeilennummern verwenden), und ich möchte für jede eindeutige ID Durchschnitt generieren (so dass der Durchschnitt für ID xxxx können keine Werte zugeordnet ID IDYYY). Es klingt wie rollapply oder rollingstat könnte Optionen sein, aber haben wenig Erfolg versucht, dieses Stück zusammen. Bitte lassen Sie mich wissen, wenn weitere Klarheit erforderlich ist. Ich habe ein Dataframe, das wie folgt aussieht (dput ist unten): Ich versuche, bewegliche Summen oder Mittelwerte der Breite 7 für HeatingDegreeDay zu berechnen. MCnt. MCntlag7. MCntlag9 in diesem Dataframe. Einige Merkmale dieser Daten zu berücksichtigen sind: unregelmäßige Zeitreihen mit fehlenden Daten und NA-Werte in den HeatingDegreeDay-Vektor. Sobald ich die 7-Tage-Bewegungssummen ODER Durchschnittswerte berechnet habe, muss ich Korrelationskoeffizienten berechnen, um mir zu helfen, zu identifizieren, welche Verzögerung (7- oder 9-Tage) am besten mit dem HeatingDegreeDay-Vektor übereinstimmt. Frage: Kann die Bewegungssumme oder die Durchschnittsberechnung mit einer Korrelationskoeffizientenberechnung in demselben Code kombiniert werden oder müssen sie in Schritten durchgeführt werden, wenn ja, wie Probleme: Bei der Berechnung der Bewegungssummen ODER Durchschnittswerte laufe ich in Schwierigkeiten. Erstens, mit rollapply, kann ich nicht passieren mehrere Vektoren zu rollapply, wie es univariate scheint. Zweitens, mit TTR s SMA Ich habe eine falsche Anzahl von Dimensionen Fehler. Ich kann nicht Rollmean verwenden, weil meine Daten NAs haben. Fehler in Lag091079, HeizungDegreeDay. Falsche Anzahl von Dimensionen Wie kann ich diese Arbeit machen Ich habe es nicht richtig. Vielen Dank für Ihre Hilfe Meine Daten ist strukturiert wie: Ich versuche zu graben einige Metriken, die auf, wie zuverlässig Clients eine Verbindung zu einem Dienst zu sehen. Die Rohdaten sind in Form von Client A, kam onlineoffline zum Zeitpunkt X. Die Verbindung ist sehr unzuverlässig, und ich möchte irgendeine Art von gleitenden Durchschnitt zu zeigen, ob die Verbindung verbessert oder nicht im Laufe der Zeit. Clients sind nicht immer verbunden, also einfach offline zu gehen bedeutet nicht, dass es ein Fehler ist. So weit, Ive genommen dann Daten und angewandt einige Annahmen, um es zu vereinfachen, nehme ich an, dass, wenn ein Client wieder innerhalb einer Minute der Trennung, dann ist das ein Fehler. Diese Ive modelliert als eine einfache impluses, dh. Client A hatte zum Zeitpunkt X Fehler. Der Teil Im, der kämpft, ist, wie man dieses Diagramm in einen gleitenden Durchschnitt umdreht (Im, das mit R spielt, um die Zahlen zu knacken). Ich glaube, ich sollte in der Lage, dies mit einem Tiefpassfilter tun, oder verwenden Sie das Zoo-Paket und Rollmean. Jedoch weiß ich nicht, wie man die Fälle behandelt, in denen der Klient einfach nicht online sein wollte.
No comments:
Post a Comment